Estimaciones de tráfico de terceros frente a Google Analytics: por qué el análisis de Rand Fishkin no es fiable
Publicado: 2023-01-24Rand Fishkin es uno de los nombres más respetados en la industria del SEO y por una buena razón. Después de lanzar y administrar Moz, una de las empresas líderes en el espacio de software de SEO, durante más de una década fundó la empresa de análisis de contenido SparkToro.
He sido un admirador del trabajo de Fishkin durante mucho tiempo. En 2015, cuando lancé mi propia agencia de marketing digital, recuerdo haber visto sus videos de Whiteboard Friday para mejorar mi juego de SEO. Y su cuenta de Twitter ha sido mi fuente de consulta para obtener pepitas de sabiduría empresarial.
Aquí está mi tweet favorito de todos los tiempos de Fishkin:
La mejor forma de vender algo: no vender nada. Gane la conciencia, el respeto y la confianza de aquellos que podrían comprar.
— Rand Fishkin (@randfish) 4 de febrero de 2015
Sus memorias Lost and Founder arrojan luz sobre su experiencia empresarial y de SEO. Es uno de mis libros de negocios favoritos: una lectura obligada para cualquiera que busque iniciar o hacer crecer un negocio y navegar por los altibajos que lo acompañan.
Recientemente, Fishkin publicó un estudio en profundidad que compara las estimaciones de tráfico de terceros con los datos de tráfico de Google Analytics en el blog de SparkToro. Este estudio ha generado mucho revuelo en la comunidad SEO y la respuesta ha sido mixta.
Si bien el análisis en sí es encomiable, los resultados parecen estar predispuestos y no logran eliminar por completo los sesgos.
Es esencial que al evaluar cualquier análisis, las personas analicen críticamente la metodología, las fuentes de datos y cualquier sesgo potencial.
En este artículo, desglosaremos el análisis de Fishkin y examinaremos por qué los datos podrían no ser confiables para los usuarios de SEO.
Colaboración con Similarweb
A los efectos de este estudio, SparkToro adquirió métricas de cuatro proveedores de datos de estimación de tráfico (Semrush, Datos, SimilarWeb y Ahrefs) y las comparó con las cifras informadas por Google Analytics.
Pero algo que no se menciona en el artículo es el hecho de que Fishkin y SparkToro trabajaron de cerca con Similarweb en este proyecto. Como tal, no es completamente imparcial.
Aquí está el tweet de Fishkin que prueba eso:
Dados estos posibles sesgos y limitaciones, es importante tomar los resultados de este análisis con pinzas.
Defecto en la Metodología
En el artículo, Fishkin afirma que más de 1000 participantes compartieron los datos de tráfico de Google Analytics de sus sitios web con SparkToro.
Según Fishkin:
“1053 sitios web compartieron tráfico con nosotros, pero limpiamos este conjunto de datos significativamente antes de ejecutar nuestros análisis. Excluimos los sitios para los cuales los terceros no tenían datos”.
No está muy claro por qué limpiaron su conjunto de datos de manera significativa. ¿Eliminaron todos los sitios para los cuales alguna de las herramientas no tenía datos? Si es así, esto podría afectar el resultado.
Si todos los sitios web se hubieran incluido en la investigación, las cifras podrían haber sido diferentes.
Es importante tener en cuenta que Similarweb no tiene datos para sitios web pequeños (>5k visitas). Esto muestra que la muestra está sesgada y definitivamente no es un conjunto aleatorio de dominios.
Otro punto de controversia en el estudio es la falta de claridad sobre el tipo de estimaciones de tráfico que proporcionan las herramientas de SEO de terceros.
Así es como Fishkin explica esta situación:
“Es difícil saber a partir de sus sitios web si Ahrefs y Semrush están tratando de estimar el tráfico general o solo el tráfico de búsqueda. Si es lo último, Semrush en particular puede querer considerar entrar en el juego de análisis competitivo”.
A diferencia de las afirmaciones de Fishkin, no es tan difícil encontrar el tipo de tráfico que estiman Semrush y Ahrefs.
Ahrefs estima solo el tráfico orgánico. Aquí hay un tweet de Tim Soulo, CTO de Ahrefs, que lo valida:
Ahrefs calcula exclusivamente el tráfico de búsqueda.
Y afaik Similarweb y Semrush dan estimaciones del tráfico general. pic.twitter.com/GnXhd0o4ch
– Tim Soulo (@timsoulo) 22 de noviembre de 2022
Semrush, por otro lado, tiene dos tipos de datos disponibles. El primero es el tráfico orgánico en las herramientas SEO y el segundo en las herramientas .Trends.
Mientras que Domain Analytics de Semrush realiza estimaciones basadas únicamente en las posiciones de las palabras clave y su tráfico estimado, Traffic Analytics realiza estimaciones mediante el análisis de datos de flujo de clics en todas las fuentes de tráfico, incluida la búsqueda.
Debido a que SparkToro comparó competidores completamente diferentes y, quizás, diferentes conjuntos de datos, la metodología de investigación y los análisis carecen de exhaustividad y transparencia.
Además, Fishkin no proporciona información sobre los países utilizados para este estudio específico.
Solo se puede suponer que SparkToro estaba analizando datos de tráfico de EE. UU. Pero luego está el hecho de que los datos mundiales son los únicos datos disponibles por defecto en Similarweb. Los datos individuales de cada país se compran por separado. Como resultado, no está claro qué datos se usaron para la comparación en este estudio.
Tampoco se mencionan las categorías/nichos de los sitios web.
También encontrará varios gráficos en el estudio. Fishkin considera que el siguiente cuadro es su favorito:
Este gráfico muestra cada uno de los cuatro proveedores de datos junto con el % de veces que su métrica de tráfico estuvo dentro del 30 % de los usuarios informados de Google Analytics para el mes. Los sitios web también se han segmentado según la cantidad de tráfico que reciben.
Ahora mi pregunta es: ¿Por qué Fishkin eligió el 30%? ¿Por qué no es 20% o 40%? ¿Cuál es la idea detrás del número?
El razonamiento detrás del porcentaje elegido del 30% para este estudio parece ser subjetivo, sin una explicación clara de por qué se seleccionó esta cifra exacta. Es solo un porcentaje aleatorio elegido específicamente para este estudio.
Si bien se permite una desviación del 30%, no está claro cuál sería el resultado si se redujera o aumentara el porcentaje. En última instancia, la respuesta a esta pregunta sigue siendo un misterio.
Luego está este gráfico que muestra el rango estimado de tráfico de terceros para 46 sitios con más de 250k usuarios mensuales de GA:
Honestamente, este gráfico no tiene sentido y no proporciona ningún valor a los usuarios. Está destinado a comparar datos de dos sitios web en particular, mostrando las discrepancias más grandes y más pequeñas en función de sus datos de Google Analytics. Este método de sacar conclusiones es muy poco fiable, ya que se basa en solo 46 sitios web, un tamaño de muestra muy pequeño.
Comentarios de la comunidad SEO
Rand Fishkin utilizó cuatro de las herramientas SaaS SEO más populares del mercado para este estudio. Como tal, era inevitable que los resultados recibieran una gran cantidad de comentarios.
Y la comunidad SEO no defraudó.
Si bien algunos expertos encontraron útiles las ideas del estudio, una gran parte de la comunidad cuestionó la metodología débil y el sesgo inherente en el estudio.
El especialista en marketing digital Kris Roadruck señaló que el estudio utilizó a los usuarios como la métrica preferida y no a las sesiones o páginas vistas para comparar Google Analytics con herramientas que informan visitas orgánicas.
¿Por qué usuarios (y no sesiones o páginas vistas)? ¿Parece una elección extraña cuando se compara con herramientas que informan búsquedas/visitas orgánicas?
– Kris Roadruck (@KrisRoadruck) 22 de noviembre de 2022
Y luego están los comentarios sobre el artículo en sí. Un usuario comentó sobre la extraña metodología de comparar los datos de tráfico de Ahrefs, que son insustanciales, con los de Semrush y Similarweb.
Pensamientos finales
Si bien el estudio de Fishkin proporciona algunos conocimientos e información valiosos, es esencial considerar otras perspectivas y fuentes al probar la precisión de las estimaciones de tráfico de terceros.
Siempre se recomienda cruzar los resultados con otras herramientas y metodologías y no depender únicamente de una fuente, que en este caso parece estar sesgada a favor de Similarweb.
Artículos relacionados
- Los 11 mejores canales de SEO en YouTube para mejorar tu juego de SEO
- BuzzSumo: La guía definitiva (18 formas avanzadas de usar BuzzSumo)
- Las 50 mejores citas de Naval Ravikant para inspirarte