Seguimiento de 20 años de búsqueda

Publicado: 2023-08-11

¿Es usted un nuevo vendedor de búsqueda que busca aprender sobre la historia de la búsqueda?

¿Quiere mantenerse actualizado sobre las últimas noticias de marketing de búsqueda?

Si es así, solo hay una persona a la que debe “seguir” para conocer el 90% de los cambios interesantes en la industria.

Este individuo tiene un sitio web; su primera publicación de blog se publicó el 2 de diciembre de 2003. El código de Google Analytics (GA) del sitio es reveladormente breve: UA-67314-1.

Hace varios meses, después de una breve interacción en Mastodon, se me dio acceso a su cuenta de GA para ver si podía contar una historia sobre la historia de la búsqueda a través de su trabajo como encargado del registro del marketing de búsqueda.

Mirando sus patrones de publicación ( Figura 1 ), está claro que el volumen no es un desafío. (Incluso revisé este gráfico varias veces para asegurarme de que era correcto. ¡Guau!)

Figura 1
Figura 1

Durante los últimos 20 años, esta persona ha publicado, en promedio:

  • 3,81 veces al día.
  • 26,67 veces por semana.
  • 116,20 veces al mes.
  • 1.437 veces al año.

Estoy seguro de que ya lo habrá adivinado, pero me refiero a Barry Schwartz y su sitio web, Search Engine Roundtable.

Este artículo cubre los puntos clave y los hallazgos de mi análisis de los datos históricos de Google Analytics de seroundtable.com.

(Si está interesado en cómo analicé los datos y qué herramientas utilicé, puede consultar la metodología a continuación).

Cobertura de los motores de búsqueda a lo largo de los años

Dado que teníamos datos de 2003 y un cartel prolífico, pensamos que sería interesante observar la cobertura del tema que mencionaba varios motores en los títulos de las publicaciones ( Figura 2 ).

Figura 2
Figura 2

Esta cifra cuenta la misma historia que todos conocemos, Google es el motor de búsqueda más cubierto en las últimas dos décadas.

Pero también es interesante notar la muerte de Yahoo y el resurgimiento de Microsoft Bing. (Si bien Microsoft Bing ha visto un aumento en la cobertura, no está claro que esto ayude desde la perspectiva del uso, como se informó en mayo).

Mirando la perspectiva de una persona de cubrir el "interés" de estos productos es una forma única de entender su historia.

En particular, la mayoría de los principales motores de búsqueda de EE. UU. recibieron menciones mínimas en los últimos 13 años, a excepción de Microsoft Bing, que adquirió una repentina prominencia recientemente debido a la integración de Microsoft con OpenAI.

Al observar la cantidad promedio de sesiones por publicación y la frecuencia de publicación a lo largo del tiempo por grupo de motores de búsqueda ( Figura 2 ), está claro que la amplia cobertura de noticias contribuye en gran medida a la importancia de Google para la audiencia de este sitio.

Una parte importante de los motores de búsqueda es la frecuencia con la que mejoran sus resultados. Podemos mirar hacia atrás en el historial de "actualizaciones de algoritmos" cubiertas junto con el volumen de búsqueda impulsado cada mes.

Notarás cómo aumentan las publicaciones después del aumento inicial de tráfico con un anuncio de actualización. El siguiente gráfico pinta una historia realmente interesante de:

  • Qué tan frecuentes son las actualizaciones (al menos las principales).
  • La conexión de Schwartz y la consistencia de su cobertura.
figura 3
figura 3

El impacto y la popularidad de las actualizaciones de Google en la comunidad de búsqueda

Etiquetamos aproximadamente 20 actualizaciones de Google con nombre. Los ocho que se muestran a continuación son los ocho mejores por sesiones generales ( Figura 4 ). Agregamos la categoría "Penalización" a este gráfico, ya que era un tema importante en la época de Penguin.

Si bien el tema aún se discute, su popularidad ha disminuido, como se ve a continuación. Esto muestra el tremendo impacto de las actualizaciones de Penguin en la comunidad de búsqueda.

Figura 4
Figura 4

Curiosamente, seroundtable.com tuvo una acción manual de Google desde aproximadamente 2007 hasta marzo de 2013.

Schwartz escribió al respecto en 2011, y podemos ver anotaciones en su cuenta de GA que apuntan a que se eliminó en marzo y se verificó mediante una solicitud de reconsideración en abril.

Su crecimiento de sesiones orgánicas/Google (YoY) para el primer trimestre de 2013 fue del 16 %, en comparación con el 25 % en el segundo trimestre ( Figura 5 ).

El crecimiento de nuevos usuarios creció 22 puntos porcentuales. A pesar de esto, el impacto es dudoso debido a los picos de interés atípicos que favorecen el segundo trimestre.

Figura 5
Figura 5

Schwartz, desde su publicación sobre la pena (y sus enlaces de patrocinio), dijo:

  • “Soy terco y soy uno de los pocos blogs de SEO que decidió no cambiar cuando Google desató su penalización”.

Años después, lo reconsideró. (Ahora faltan muchos detalles en GA, pero la penalización manual probablemente no tuvo un impacto drástico).

Seroundtable.com también fue víctima de la actualización de Panda 4.1 en 2014 ( Figura 6 ).

Como indicó Schwartz en 2015, el rendimiento comenzó a mejorar modestamente con Panda 4.2 a mediados de 2015 hasta mayo de 2020, cuando hubo otra caída repentina.

Figura 6
Figura 6

miembros del equipo de Google

Identificamos a 10 empleados de Google mencionados en los títulos de las publicaciones ( Figura 7 ).

De los 10, restringimos la lista para mostrar solo aquellos que comunican información regularmente a la comunidad SEO.

Esta es mi vista favorita, ya que muestra claramente las eras de Matt Cutts vs. John Mueller.

Como enlace público para la búsqueda de Google, Danny Sullivan no es tan pronunciado en las publicaciones. Es importante tener en cuenta que cualquier mención de él antes de finales de 2017 se referiría a su cargo anterior antes de asumir este cargo.

Como fundador de Search Engine Watch y más tarde editor fundador de Search Engine Land, Sullivan es sin duda una parte integral de la historia de SEO.

Figura 7
Figura 7

Cobertura de herramientas SEO

La industria de SEO no tiene escasez de herramientas. Al revisar las publicaciones de Schwartz, podemos ver que ha mencionado una amplia gama de empresas de herramientas a lo largo de los años.

Si bien las publicaciones dedicadas a una empresa en particular son bastante raras, Schwartz ha cubierto estudios de datos y anuncios de productos.

A continuación ( Figura 8a ), podemos ver la frecuencia de cobertura en publicaciones desde 2003. Este dato difiere de otros datos en este artículo ya que considera menciones en el título y contenido del artículo.

Nombre de la herramienta Recuento de menciones
Moz 924
Guardabosques de rango 561
Accuranker 297
Algoroo 292
Clasificaciones web avanzadas 289
SEO cognitivo 232
SERPmétricas 116
Yoast 91
Majestuoso 53
SERPs.com 46
SEMrush 44
Rana Gritando 34
Ahrefs 29
Sistrix 21
Rastreo profundo 20
SimilarWeb 13
Clasificación SE 12
HARO 9
Estadística SERP 7
SERP Woo 6
Figura 8a

Históricamente, podemos ver el beneficio para los proveedores de herramientas de crear métricas de clasificación agregadas como Mozcast.

Menciones frecuentes y crecientes con cada fluctuación del ranking. También queda claro aquí el poder de permanencia que tiene Moz.

Figura 8b
Figura 8b

Publicaciones principales

La siguiente tabla ( Figura 9 ) muestra la publicación principal de cada año por páginas vistas únicas.

Hay contenido con un atractivo más amplio (fuera de la comunidad de SEO) y contenido que está más específicamente dirigido a los especialistas en marketing de motores de búsqueda.

Me pregunto cómo decide este equilibrio. Me sorprendió un poco esta lista, pero tiene sentido.

Año Título Visitas de página únicas
2005 Primera propuesta de matrimonio a través de un motor de búsqueda 3,568
2006 Google Earth – Descarga gratuita 50,669
2007 Google Earth – Descarga gratuita 44,214
2008 Google Earth – Descarga gratuita 64,097
2009 Estafa: Google Money System o Google Kit 88,657
2010 Cómo configurar unidades de video de Google AdSense a través de YouTube 78,537
2011 Cómo configurar unidades de video de Google AdSense a través de YouTube 148,083
2012 Google celebra el primer autocine 126,629
2013 Asesinato en Google Maps en 52.376552,5.198303 en Holanda 265,977
2014 Asesinato en Google Maps en 52.376552,5.198303 en Holanda 110,222
2015 Google Analytics cambia la terminología: las sesiones y los usuarios reemplazan las visitas y los únicos 68,565
2016 Cómo obtener la longitud/latitud de una ubicación usando Google Maps en iPhone 129,300
2017 Big Google Algorithm Fred Update parece enlaces relacionados 175,488
2018 Ahora puede optar por eliminar las búsquedas de tendencias en la aplicación de búsqueda de Google 125,922
2019 Ahora puede optar por eliminar las búsquedas de tendencias en la aplicación de búsqueda de Google 181,556
2020 El logotipo de Google dice gracias a los ayudantes de coronavirus 413,202
2021 Ahora puede optar por eliminar las búsquedas de tendencias en la aplicación de búsqueda de Google 103,498
2022 Actualización de contenido útil de Google para orientar el contenido escrito para las clasificaciones de búsqueda 226,842
2023 Asesinato en Google Maps en 52.376552,5.198303 en Holanda 55,533

Figura 9

Comentarios

Seroundtable.com, que yo sepa, siempre ha permitido comentarios, y a la comunidad de SEO le encanta compartir opiniones sobre las travesuras de Google.

Esta vista ( Figura 10 ), sugerida por John Mueller, muestra publicaciones a lo largo del tiempo por vistas de página únicas y comentarios (tamaño de burbuja).

Figura 10
Figura 10

Esto se vuelve interesante si miramos los datos por categoría de tema.

Por ejemplo, comparemos el contenido de "Actualizaciones de Google" con el contenido de "Publicidad paga" ( Figura 11a y 11b ).

Figura 11a
Figura 11a
Figura 11b
Figura 11b

Es mucho menos acalorado en el lado pago, pero muestra un mayor nivel de interés, emoción e interacción para las publicaciones que cubren cambios que potencialmente pueden borrar meses o años de esfuerzo.

Enlaces

Schwartz no se avergüenza de vincularse con otros.

Como se mencionó anteriormente, Schwartz agregó a regañadientes un atributo nofollow a los enlaces de patrocinio años después de recibir una modesta penalización de Google en 2007.

Schwartz ha vinculado desde el contenido de su publicación a casi 4000 dominios únicos durante los últimos 20 años ( Figura 12 ).

Este gráfico muestra los 10 principales dominios vinculados del conjunto de datos, lo que ilustra claramente el valor que Twitter le ha brindado a Schwartz por mostrar información sobre la que escribir durante los últimos 10 años.

Figura 12
Figura 12

El siguiente gráfico elimina Twitter y Google y hace lo mismo ( Figura 13 ).

Comenzamos a ver algunos sitios que los nuevos SEO pueden no conocer, pero muchos pueden recordar con diversos grados de cariño.

Figura 13
Figura 13

Obtenga el boletín informativo diario en el que confían los especialistas en marketing.

Procesando .. por favor espere.

Ver términos.


Visualización de datos de tendencias de búsqueda a lo largo del tiempo

Aquí hay un divertido gráfico de barras de carreras que muestra las principales categorías durante los últimos 20 años ( Figura 14 ). Esto sirve como un recordatorio de la afluencia de pánico dentro de la comunidad SEO durante las actualizaciones de Google.

Hasta cierto punto, esto trae consuelo, ya que aunque el SEO está cambiando rápidamente, siempre ha sido así.

Figura 14

Figura 14 ( Vea la animación completa aquí ).

Schwartz publica como un robot

Pensé que algo interesante aquí podría usarse para señalar dónde se priorizó un día determinado para publicar, pero no.

Publicar tal como sucede, y sucede mucho.

Menciono que Schwartz es un robot basado en la extraordinaria consistencia que ha mostrado al publicar durante muchos años.

He tenido dificultades para comprometerme con el mismo proyecto durante más de seis meses, por lo que 20 años es más que increíble ( Figura 15 ).

Figura 15
Figura 15

A modo de balance, aquí está el número de sesiones por día de la semana ( Figura 16 ). Supongo que realmente no importa, aunque la mitad de semana es el claro ganador.

Figura 16
Figura 16

Mirando los tipos de publicaciones publicadas en los últimos años, no parece haber una gran diferencia entre los tipos de publicaciones entre semana ( Figura 17 ).

Donde sí vemos diferencias es en sábado y domingo, que son días que suelen involucrar eventos temporales de fuerte importancia.

Históricamente, Schwartz rara vez ha publicado los sábados y domingos, con un 0,74 % y un 0,17 % de todas las publicaciones, respectivamente.

Esto tiene sentido intuitivamente ya que es más probable que rompa su fin de semana por temas que son realmente importantes de cubrir.

Figura 17
Figura 17

Categorías importantes y número de palabras

Estas son las categorías principales de las revisadas en función de la pendiente ( Figura 18 ). Como referencia, una pendiente es una medida que describe la dirección y la inclinación de la línea.

Una de las razones por las que estas categorías funcionan tan bien desde la perspectiva del tráfico puede ser que este tipo de contenido sale de la típica burbuja mundial de SEO y llega a la población general de interés en torno a Google.

Figura 18
Figura 18

Schwartz ha declarado a menudo que le importa más dar a conocer las noticias que la profundidad con la que se cubren.

Esto está respaldado por datos al observar la relación entre las sesiones y el recuento de palabras ( Figura 19 ).

Figura 19
Figura 19

Cómo los lectores de Schwartz reflejan la industria del SEO y el interés en diferentes segmentos

Subsecciones de SEO

Aquí es donde las categorías pueden meterme en problemas.

En un nivel alto, aquí está el interés relativo en la industria de SEO con respecto a los seguidores y lectores de Schwartz para los cuatro segmentos principales de SEO ( Figura 20 ).

Como señaló Mueller, se puede ver muy bien la década de los dispositivos móviles.

Figura 20
Figura 20

IA y SEO

Bien, solo quería hacer un diagrama de árbol, pero esta es una vista genial del total de sesiones por publicaciones de la categoría "Aprendizaje automático" ( Figura 21 ).

Tenga en cuenta que este es el total de sesiones de la mejor publicación en cada categoría. Esto debería controlar la relativa novedad de algunas de las categorías.

Me parece fascinante que la entrada al léxico de BERT haya tenido un impacto mayor que los cambios recientes en el aprendizaje automático.

Figura 21
Figura 21

héroe de SEO

Para todos los gurús de la página, este es el nivel de interés comparativo para los miembros de esta categoría según las sesiones de la publicación con mejor rendimiento ( Figura 22 ).

Una nota aquí de que "Meta" puede estar inflado debido a las coincidencias con la empresa, Meta (Facebook).

Figura 22
Figura 22

Estas son las principales categorías por táctica ( Figura 23 ). Como esto es en el lapso de 20 años, varias de estas tácticas en realidad podrían penalizar a un sitio web.

Esto muestra bien el accidentado pasado del SEO y la naturaleza de las presiones de relaciones públicas de Google para denunciar tácticas que intentan jugar con su sistema o dañar a otros.

Figura 23
Figura 23

Pagado

Para mis amigos del lado pago, aquí están los miembros del grupo de publicaciones "Publicidad paga". ( Figura 24 ). ¿Quién recuerda Obertura?

Figura 24
Figura 24

navegadores

Esto fue sorprendente para mí en base a la cobertura de Google en este sitio web y cuán desequilibrada es la participación de mercado de Google (62,85 %), pero felicitaciones a Schwartz por la cobertura uniforme ( Figura 25 ).

Figura 24
Figura 25

Eventos

Algunas publicaciones anteriores en la historia promovieron conferencias específicas como SMX, pero esto fue durante un período relativamente corto, por lo que se eliminaron del conjunto de datos.

Curiosamente, el contenido dominante de COVID-19, que duró aproximadamente un año, se comparó con otras categorías durante 20 años ( Figura 26 ).

Además, definitivamente necesitamos más huevos de Pascua de Google. Schwartz me dijo que solía hacer eventos de blogs en vivo, pero se detuvo hace más de una década.

Eliminé la mayoría (¿todos?) de los títulos del conjunto de datos que no tenían al menos alguna mención de un tema relevante (p. ej., el episodio de vlog n.° 1234 Weekly Roundup es un ejemplo de uno que se eliminaría).

Schwartz también mencionó que dejó de cubrir los logotipos de Google cuando otros editores comenzaron a cubrirlos.

“Perdieron su diversión”.

¿Qué tan genial es hacer algo tan impulsado por la pasión y no por los clics?

Figura 26
Figura 26

El historial de búsqueda en 32,926 publicaciones y contando

Página de autor de Barry Schwartz en Search Engine Roundtable
Página de autor de Barry Schwartz en Search Engine Roundtable , con 32.926 artículos publicados al momento de escribir este artículo.

Es interesante volver y contar todo lo que ha cambiado en la industria y conocer los días de búsqueda del "salvaje oeste".

Y tenemos que agradecer a Barry Schwartz por 20 años cubriendo la industria sin falta.

Si se trata de marketing de búsqueda, sabemos que Schwartz probablemente lo haya visto o cubierto.

Eso no es nuevo.

Quiero agradecer a John Mueller y Patrick Stox por sus recomendaciones y controles de cordura sobre la información y los datos proporcionados aquí. Danny Sullivan también revisó para un control de cordura adicional.

Los datos y la metodología

Comencé rastreando seroundtable.com en Screaming Frog, extrayendo cuidadosamente el meta contenido de la publicación como Autor, Fecha de publicación y Categoría usando extracción personalizada. También saqué datos de GA, aunque como esto era de 2005, sabía que no sería suficiente. Los datos HTML se enviaron a un CSV para su posterior procesamiento.

Dado que hay muchos autores en seroundtable.com, limité el resto del análisis solo a las publicaciones escritas por Schwartz (escribió más de 32,000).

Para comprender mejor cuánto ha contribuido Schwartz al sitio web, aquí hay un vistazo rápido a los 10 autores principales y cuántos artículos se les atribuyen ( Figura 27 ).

Autor Artículos
barry schwartz 32,786
Tamar Weinberg 1,875
ben pfeiffer 351
chris boggs 246
cre8pc 119
punto digital 40
nacho 34
mono verde malvado 24
seo chico 22
cshel 21
Figura 27

Luego configuré una extracción de API de GA API para extraer páginas de destino y sesiones mensuales para todos los usuarios. Además, extrajimos datos sobre páginas vistas y enlaces externos.

Después de extraer todos los datos, noté que seroundtable.com usaba AMP, lo que significa dos conjuntos de URL para muchos de los artículos. En cuanto a las babosas (p. ej.,/category/this-is-a-slug.html), afortunadamente, todas eran únicas.

Necesitaba eliminar las categorías, las páginas de autor y otras páginas en las que el tema no se podía deducir del título, limitándome a donde Screaming Frog encontró que los autores lo limpiaron fácilmente.

A partir de ahí, limpié las rutas de URL a slugs únicos y las usé como mi coincidencia entre los datos de URL rastreados y los datos de GA.

Vale la pena señalar que los datos de seroundtable.com comienzan en GA en el cuarto trimestre de 2005. La primera publicación fue del cuarto trimestre de 2003. Como señaló Patrick Stox, el 14 de noviembre de 2005 fue el lanzamiento oficial de GA, lo que significa nuestros datos abarcan todos los datos a través del nacimiento y la muerte de GA como todos lo conocíamos.

Antes de esto, el sitio usaba Urchin Analytics, que se convirtió en GA. De los 27 309 slug únicos encontrados en el rastreo, solo el 0,2 % no se encontró en los datos de GA. La mayoría fueron después del corte de datos del 30 de junio de 2023.

Procesamiento del lenguaje natural (PNL)

Después de asegurarme de que tenía los datos de la página y los datos de Analytics limpios, ejecuté los títulos de las páginas a través de un proceso que los convierte en ngrams. Un ngrama son agrupaciones de n términos. Por ejemplo, “la rana verde”, estaría compuesta por: “la”, “verde”, “rana” como 1 gramo, y “la verde”, “rana verde” como 2 gramos. Repasar esto sobre los títulos y contar la frecuencia de cada nivel de gramo permite que surjan conceptos importantes.

Luego, analizamos todos los ngramas importantes a través de un modelo de lenguaje grande (LLM) para ver qué tan bien podía seleccionar temas importantes y combinarlos en categorías relevantes. Aquí es donde vemos las limitaciones de los LLM en temas de nicho. Aunque los modelos ayudaron en el proceso, hubo bastante revisión manual de varios ngramas en busca de conceptos que pudieran crear una categoría.

Además, hay muchas entidades y conceptos como "Google" y "búsqueda orgánica" en el conjunto de datos que están presentes en muchas publicaciones, mientras que temas temporalmente importantes como "colibrí" solo duran unas pocas publicaciones y confunden muchísimo los modelos de lenguaje. .

Puede revisar los datos de categoría aquí y revisar las principales designaciones de categoría en el gráfico a continuación. Emparejamos las categorías con los títulos utilizando la coincidencia ordenada por longitud de palabra inversa para asegurar que las frases más detalladas coincidieran antes que las frases más amplias (más cortas). Vale la pena señalar que dividimos cada tema en una categoría amplia y una subcategoría más detallada.

El siguiente gráfico ( Figura 28 ) contiene las categorías generales con sesiones por encima del percentil 25. También tenga en cuenta que el proceso de clasificación es muy subjetivo. Sin duda, los espectadores encontrarán temas que habrían categorizado de manera diferente.

Figura 28
Figura 28

Los datos de enlaces externos y las menciones de herramientas de SEO se manejaron a través de rastreos separados dirigidos solo a las partes de cada página dedicadas al contenido principal.

Los datos de la herramienta SEO difieren de los datos categorizados en que consideran el título y el contenido. La categorización de las publicaciones se realizó solo en el título.

La tabla, la categorización y los datos históricos (anuales) de páginas vistas y sesiones están disponibles en Seguimiento de 20 años de datos de búsqueda.


Las opiniones expresadas en este artículo pertenecen al autor invitado y no necesariamente a Search Engine Land. Los autores del personal se enumeran aquí.