Urmărirea a 20 de ani de căutare
Publicat: 2023-08-11Sunteți un agent de marketing nou care dorește să învețe despre istoria căutării?
Doriți să fiți la curent cu cele mai recente știri de marketing de căutare?
Dacă da, există o singură persoană pe care trebuie să o „urmărești” pentru a cunoaște 90% din schimbările interesante din industrie.
Această persoană are un site web; prima sa postare pe blog a fost publicată pe 2 decembrie 2003. Codul Google Analytics (GA) al site-ului este foarte scurt: UA-67314-1.
Cu câteva luni în urmă, după o scurtă interacțiune cu Mastodon, mi s-a dat acces la contul său GA pentru a vedea dacă pot spune o poveste despre istoria căutării prin munca sa ca păstrător de evidențe al marketingului de căutare.
Privind modelele sale de postare ( Figura 1 ), este clar că volumul nu este o provocare. (Am verificat chiar și acest grafic de mai multe ori pentru a mă asigura că este corect. Wow!)
În ultimii 20 de ani, această persoană a postat, în medie:
- de 3,81 ori pe zi.
- 26,67 ori pe săptămână.
- 116,20 ori pe lună.
- de 1.437 de ori pe an.
Sunt sigur că ați ghicit până acum, dar mă refer la Barry Schwartz și site-ul său, Search Engine Roundtable.
Acest articol acoperă principalele concluzii și concluzii din analiza mea a datelor istorice Google Analytics ale seroundtable.com.
(Dacă sunteți interesat de modul în care am analizat datele și ce instrumente am folosit, puteți consulta metodologia de mai jos.)
Acoperirea motorului de căutare de-a lungul anilor
Deoarece aveam date din 2003 și un poster prolific, ne-am gândit că ar fi interesant să ne uităm la acoperirea subiectului care menționa diverse motoare în titlurile postărilor ( Figura 2 ).
Această cifră spune aceeași poveste pe care o știm cu toții, Google este cel mai acoperit motor de căutare din ultimele două decenii.
Dar este, de asemenea, interesant de observat moartea Yahoo și renașterea Microsoft Bing. (Deși Microsoft Bing a înregistrat o creștere a acoperirii, nu este clar că acest lucru ajută din perspectiva utilizării, așa cum sa raportat în mai.)
Privind perspectiva unei persoane de a acoperi „interesul” a acestor produse este un mod unic de a le înțelege istoria.
În special, majoritatea motoarelor de căutare majore din SUA au primit mențiuni minime în ultimii 13 ani, cu excepția Microsoft Bing, care a câștigat o importanță bruscă recent datorită integrării Microsoft cu OpenAI.
Analizând numărul mediu de sesiuni per postare și frecvența postării de-a lungul timpului, în funcție de cohorta motoarelor de căutare ( Figura 2 ), este clar că acoperirea extinsă a știrilor contribuie în mare măsură la importanța Google pentru publicul acestui site.
O parte importantă a motoarelor de căutare este cât de des își îmbunătățesc rezultatele. Ne putem uita înapoi la istoricul „actualizărilor de algoritm” acoperit împreună cu volumul de căutare generat în fiecare lună.
Veți observa cum cresc postările după creșterea inițială a traficului cu un anunț de actualizare. Graficul de mai jos descrie o poveste cu adevărat interesantă despre:
- Cât de frecvente sunt actualizările (cel puțin cele majore).
- Legătura lui Schwartz cu și consistența acoperirii sale.
Impactul și popularitatea actualizărilor Google în comunitatea de căutare
Am etichetat aproximativ 20 de actualizări Google numite. Cele opt prezentate mai jos sunt primele opt după sesiuni generale ( Figura 4 ). Am adăugat categoria „Penalty” la acest grafic, deoarece acesta era un subiect puternic pe vremea lui Penguin.
În timp ce subiectul este încă discutat, popularitatea sa a scăzut, așa cum se vede mai jos. Acest lucru arată impactul extraordinar al actualizărilor Penguin asupra comunității de căutare.
Destul de interesant, seroundtable.com a avut o acțiune manuală de la Google din aproximativ 2007 până în martie 2013.
Schwartz a scris despre asta în 2011 și putem vedea adnotări în contul său GA care indică faptul că acesta a fost eliminat în martie și verificat prin cererea de reevaluare în aprilie.
Creșterea sesiunii Google/Organic (YoY) pentru T1 2013 a fost de 16%, comparativ cu 25% în T2 ( Figura 5 ).
Creșterea noilor utilizatori a crescut cu 22 de puncte procentuale. În ciuda acestui fapt, impactul este dubios din cauza vârfurilor aberante ale interesului care favorizează trimestrul al doilea.
Schwartz, din postul său de pedeapsă (și linkurile de sponsorizare), a spus:
- „Sunt încăpățânat și sunt unul dintre puținele bloguri SEO care au decis să nu se schimbe atunci când Google și-a dezlănțuit penalizarea.”
Ani mai târziu, s-a reconsiderat. (Multe detalii lipsesc acum în GA, dar penalizarea manuală probabil că nu a avut un impact drastic.)
Seroundtable.com a căzut și el victima actualizării Panda 4.1 în 2014 ( Figura 6 ).
După cum a indicat Schwartz în 2015, performanța a început să se îmbunătățească modest cu Panda 4.2 la jumătatea anului 2015 până în mai 2020, când a avut loc o nouă scădere bruscă.
Membrii echipei Google
Am identificat 10 angajați Google menționați în titlurile postărilor ( Figura 7 ).
Din cele 10, am restricționat lista pentru a afișa numai cei care comunică în mod regulat informații către comunitatea SEO.
Aceasta este viziunea mea preferată, deoarece arată clar epocile Matt Cutts vs. John Mueller.
În calitate de agent de legătură public pentru Căutarea Google, Danny Sullivan nu este așa de pronunțat în postări. Este important de menționat că orice mențiuni despre el înainte de sfârșitul anului 2017 s-ar referi la rolul său anterior înainte de a ocupa această funcție.
În calitate de fondator al Search Engine Watch și mai târziu editor fondator al Search Engine Land, Sullivan este, fără îndoială, o parte integrantă a istoriei SEO.
Acoperirea instrumentului SEO
Industria SEO nu are lipsă de instrumente. Analizând postările lui Schwartz, putem vedea că el a menționat o gamă largă de companii de instrumente de-a lungul anilor.
În timp ce postările dedicate unei anumite companii sunt destul de rare, Schwartz a acoperit studii de date și anunțuri despre produse.
Mai jos ( Figura 8a ), putem vedea frecvența de acoperire a postărilor din 2003. Aceste date diferă de alte date din acest articol, deoarece iau în considerare mențiunile din titlul și conținutul articolului.
Nume instrument | Menționează Contele |
Moz | 924 |
Ranger de rang | 561 |
Accuranker | 297 |
Algoroo | 292 |
Clasamente web avansate | 289 |
SEO cognitiv | 232 |
SERPmetrics | 116 |
Yoast | 91 |
Maiestuos | 53 |
SERPs.com | 46 |
SEMrush | 44 |
Broasca care tipa | 34 |
Ahrefs | 29 |
Sistrix | 21 |
DeepCrawl | 20 |
SimilarWeb | 13 |
Clasament SE | 12 |
HARO | 9 |
SERPStat | 7 |
SERPWoo | 6 |
Din punct de vedere istoric, putem vedea beneficiile pentru furnizorii de instrumente de a crea valori agregate de clasare, cum ar fi Mozcast.
Mențiuni frecvente și în creștere cu fiecare fluctuație a clasamentului. Este, de asemenea, clar aici puterea de rezistență pe care Moz o are.
Postări de top
Următorul tabel ( Figura 9 ) arată postarea de top pentru fiecare an după afișări de pagină unice.
Există conținut cu un atractiv mai larg (în afara comunității SEO) și conținut care este mai îngust direcționat către agenții de marketing în motoarele de căutare.
Mă întreb cum decide el acest echilibru? Am fost puțin surprins de această listă, dar are sens.
An | Titlu | Afișări de pagină unice |
2005 | Prima propunere de nuntă prin intermediul motorului de căutare | 3.568 |
2006 | Google Earth – Descărcare gratuită | 50.669 |
2007 | Google Earth – Descărcare gratuită | 44.214 |
2008 | Google Earth – Descărcare gratuită | 64.097 |
2009 | Înșelătorie: Google Money System sau Google Kit | 88.657 |
2010 | Cum să configurați unitățile video Google AdSense prin YouTube | 78.537 |
2011 | Cum să configurați unitățile video Google AdSense prin YouTube | 148.083 |
2012 | Google celebrează primul cinematograf Drive-In | 126.629 |
2013 | Crimă Google Maps la 52.376552,5.198303 în Țările de Jos | 265.977 |
2014 | Crimă Google Maps la 52.376552,5.198303 în Țările de Jos | 110.222 |
2015 | Google Analytics modifică terminologia: sesiunile și utilizatorii înlocuiesc vizitele și unici | 68.565 |
2016 | Cum să obțineți longitudinea/latitudinea unei locații folosind Google Maps pe iPhone | 129.300 |
2017 | Marea actualizare a algoritmului Google Fred pare legată de legături | 175.488 |
2018 | Acum puteți opta pentru a elimina căutările populare din aplicația de căutare Google | 125.922 |
2019 | Acum puteți opta pentru a elimina căutările populare din aplicația de căutare Google | 181.556 |
2020 | Sigla Google vă mulțumesc, ajutoarelor de coronavirus | 413.202 |
2021 | Acum puteți opta pentru a elimina căutările populare din aplicația de căutare Google | 103.498 |
2022 | Actualizare de conținut util Google pentru a viza conținutul scris pentru clasamentele de căutare | 226.842 |
2023 | Crimă Google Maps la 52.376552,5.198303 în Țările de Jos | 55.533 |
Figura 9
Comentarii
Seroundtable.com a permis, din câte știu eu, întotdeauna comentarii, iar comunității SEO îi place să împărtășească părerile despre prostiile Google.
Această vizualizare ( Figura 10 ), sugerată de John Mueller, arată postările de-a lungul timpului prin vizualizări de pagină și comentarii unice (dimensiunea bulei).
Acest lucru devine interesant dacă ne uităm la datele pe categorii de subiecte.
De exemplu, să comparăm conținutul din „Actualizări Google” cu conținutul „Publicitate plătită” ( Figura 11a și 11b ).
Este mult mai puțin încălzit pe partea plătită, dar arată nivelul crescut de interes, emoție și interacțiune pentru postările care acoperă schimbări care pot șterge luni sau ani de efort.
Legături
Schwartz nu se sfiește să se conecteze cu ceilalți.
După cum am menționat mai devreme, Schwartz a adăugat fără tragere de inimă un atribut nofollow link-urilor de sponsorizare la ani după ce a primit o penalizare modestă de la Google în 2007.
Schwartz a creat linkuri din conținutul postării sale la aproape 4.000 de domenii unice în ultimii 20 de ani ( Figura 12 ).
Acest grafic arată primele 10 domenii conectate din setul de date, ilustrând în mod clar valoarea pe care Twitter i-a oferit-o lui Schwartz pentru a afișa informații despre care să scrie în ultimii 10 ani.
Următorul grafic elimină Twitter și Google și face același lucru ( Figura 13 ).
Începem să vedem câteva site-uri de care SEO-urile mai noi ar putea să nu le cunoască, dar mulți s-ar putea să-și amintească cu diferite grade de pasiune.
Obțineți buletinele informative zilnice pe care se bazează marketerii.
Vezi termenii.
Vizualizarea datelor tendințelor de căutare în timp
Iată o diagramă cu bare de curse distractive care arată categoriile de top din ultimii 20 de ani ( Figura 14 ). Acest lucru servește ca un memento al afluxului de panică în cadrul comunității SEO în timpul actualizărilor Google.
Într-o anumită măsură, acest lucru aduce confort, deoarece, deși SEO se schimbă rapid, așa a fost întotdeauna.
Figura 14 ( vezi animația completă aici .)
Schwartz postează ca un robot
M-am gândit că ceva interesant aici ar putea fi folosit pentru a indica locul în care o anumită zi a fost prioritizată pentru postare, dar nu.
Postează așa cum se întâmplă și se întâmplă des.
Menționez că Schwartz este un robot bazat pe extraordinara consistență de care a dat dovadă în postarea de-a lungul multor ani.
Am întâmpinat dificultăți să mă angajez în același proiect timp de peste șase luni, așa că 20 de ani sunt dincolo de uimitoare ( Figura 15 ).
Pentru echilibru, iată numărul de sesiuni pe zi a săptămânii ( Figura 16 ). Cred că chiar nu contează, deși mijlocul săptămânii este câștigătorul clar.
Privind tipurile de postări publicate în ultimii ani, nu pare să existe o diferență mare între tipurile de postări în zilele lucrătoare ( Figura 17 ).
Unde vedem diferențe este sâmbăta și duminica, care sunt zile care implică de obicei evenimente temporale de o importanță puternică.
Schwartz a postat rar sâmbătă și duminică, cu 0,74% și, respectiv, 0,17% din toate postările.
Acest lucru are sens intuitiv, deoarece ar fi mai probabil să se întrerupă de weekend-ul său pentru articole care sunt cu adevărat importante de acoperit.
Categoriile importante și numărul de cuvinte
Acestea sunt categoriile de top dintre cele analizate pe baza pantei ( Figura 18 ). Pentru referință, o pantă este o măsură care descrie direcția și abruptul liniei.
Unul dintre motivele pentru care aceste categorii funcționează atât de bine din perspectiva traficului poate fi faptul că acest tip de conținut iese din balonul tipic SEO mondial și în populația generală de interes din jurul Google.
Schwartz a afirmat adesea că îi pasă mai mult de a aduna știrile decât de profunzimea cu care sunt acoperite.
Acest lucru este susținut de date atunci când se analizează relația dintre sesiuni și numărul de cuvinte ( Figura 19 ).
Cum reflectă cititorii lui Schwartz industria SEO și interesul pentru diferite segmente
Sub-secțiuni SEO
Aici categoriile m-ar putea pune în probleme.
La un nivel înalt, iată interesul relativ în industria SEO în ceea ce privește adepții și cititorii lui Schwartz pentru cele patru segmente majore ale SEO ( Figura 20 ).
După cum a subliniat Mueller, puteți vedea frumos deceniul de mobil.
AI și SEO
OK, am vrut doar să fac o hartă arborescentă, dar aceasta este o vedere grozavă a sesiunilor totale după postări din categoria „Învățare automată” ( Figura 21 ).
Vă rugăm să rețineți că acesta este numărul total de sesiuni ale celei mai bune postări din fiecare categorie. Acest lucru ar trebui să controleze noutatea relativă a unora dintre categorii.
Mi se pare fascinant faptul că intrarea în lexicul BERT a avut un impact mai mare decât modificările recente ale învățării automate.
Erou SEO
Pentru toți guru de pe pagină de acolo, iată nivelul comparativ de interes pentru membrii acestei categorii, bazat pe sesiunile postării cu cele mai bune performanțe ( Figura 22 ).
Notă aici că „Meta” poate fi umflat din cauza potrivirilor cu compania, Meta (Facebook).
Iată principalele categorii după tactică ( Figura 23 ). Deoarece acest lucru se desfășoară pe o perioadă de 20 de ani, o serie de aceste tactici ar putea penaliza un site web.
Acest lucru arată bine trecutul în carouri al SEO și natura îndrumărilor de PR Google pentru a apela la tactici care încearcă să-și joce sistemul sau să-i facă rău altora.
Plătit
Pentru prietenii mei din partea plătită, iată membrii grupului de postări „Reclamă plătită”. ( Figura 24 ). Cine își amintește de Overture?
Browsere
Acest lucru a fost surprinzător pentru mine, având în vedere cât de mult este acoperit Google pe acest site web și cât de dezafectată este cota de piață a Google (62,85%), dar jos pălăria lui Schwartz pentru acoperirea uniformă ( Figura 25 ).
Evenimente
Unele postări anterioare din istorie au promovat conferințe specifice, cum ar fi SMX, dar acest lucru a avut loc pe o perioadă relativ scurtă, așa că au fost eliminate din setul de date.
Interesant, conținutul dominant COVID-19, care a durat aproximativ un an, a fost comparat cu alte categorii de peste 20 de ani ( Figura 26 ).
De asemenea, cu siguranță avem nevoie de mai multe ouă de Paște de la Google. Schwartz mi-a spus că obișnuia să facă evenimente live pe blog, dar s-a oprit acum peste un deceniu.
Am eliminat majoritatea (toate?) titlurilor din setul de date care nu aveau cel puțin o mențiune despre un subiect relevant (de exemplu, episodul vlog #1234 Weekly Roundup este un exemplu de unul care ar fi eliminat).
Schwartz a mai menționat că a încetat să mai acopere siglele Google când alți editori au început să le acopere.
„Și-au pierdut distracția.”
Cât de tare este să faci ceva atât de condus de pasiune și nu de clicuri?
Istoricul căutărilor în 32.926 de postări și în numărare
Este interesant să ne întoarcem și să relatăm tot ce s-a schimbat în industrie și să cunoaștem zilele de căutare ale „vestului sălbatic”.
Și îi mulțumim lui Barry Schwartz pentru 20 de ani de acoperire fără greșeală a industriei.
Dacă este vorba de marketing de căutare, știm că Schwartz a văzut-o sau a acoperit-o.
Nu e nou.
Vreau să le mulțumesc lui John Mueller și Patrick Stox pentru recomandările și verificările lor de sănătate cu privire la informațiile și datele furnizate aici. Danny Sullivan a trecut și el în revistă pentru o verificare suplimentară de sănătate.
Datele și metodologia
Am început prin a accesa cu crawlere seroundtable.com în Screaming Frog, trăgând cu atenție conținut meta post cum ar fi Autor, Data postării și Categorie folosind extragerea personalizată. Am extras și date GA, deși din moment ce acestea erau din 2005, știam că nu va fi suficient. Datele HTML au fost trimise într-un CSV pentru procesare ulterioară.
Întrucât sunt mulți autori pe seroundtable.com, restul analizei l-am limitat doar la postări scrise de Schwartz (a scris peste 32.000 dintre ele).
Pentru a înțelege mai bine cât de mult a contribuit Schwartz la site, iată o privire rapidă asupra primilor 10 autori și câte articole le sunt atribuite ( Figura 27 ).
Autor | Articole |
Barry Schwartz | 32.786 |
Tamar Weinberg | 1.875 |
Ben Pfeiffer | 351 |
Chris Boggs | 246 |
cre8buc | 119 |
punct digital | 40 |
nacho | 34 |
evilgreenmonkey | 24 |
seo tip | 22 |
cshel | 21 |
Apoi am configurat o extragere API din GA API pentru a extrage pagini de destinație lunare și sesiuni pentru toți utilizatorii. În plus, am extras date despre afișările de pagină și linkurile externe.
După ce am extras toate datele, am observat că seroundtable.com a folosit AMP, adică două seturi de adrese URL pentru multe dintre articole. Privind la melci (de exemplu,/category/this-is-a-slug.html), din fericire, acestea au fost toate unice.
Trebuia să elimin categoriile, paginile de autor și alte pagini în care subiectul nu era dedus din titlu - limitându-mă la locul în care Screaming Frog a găsit Autorii au curățat cu ușurință acest lucru.
De acolo, am curățat căile URL la slug-uri unice și am folosit-o ca potrivire între datele URL accesate cu crawlere și datele GA.
Este de remarcat faptul că datele seroundtable.com încep în GA în trimestrul 4 din 2005. Prima postare a fost din trimestrul 4 din 2003. După cum a subliniat Patrick Stox, 14 noiembrie 2005, a fost lansarea oficială a GA, adică datele noastre cuprind toate datele de la nașterea și moartea lui GA așa cum le știam cu toții.
Înainte de aceasta, site-ul folosea Urchin Analytics, care a devenit GA. Din cele 27.309 de melci unici găsite în crawl, doar 0,2% nu au fost găsite în datele GA. Cele mai multe au fost după limitarea datelor din 30 iunie 2023.
Procesarea limbajului natural (NLP)
După ce m-am asigurat că am date de pagină curate și date Analytics, am rulat titlurile paginilor printr-un proces care le face tranziția la ngrams. O ngramă este grupări de n termeni. De exemplu, „broasca verde”, ar fi compusă din: „cea”, „verde”, „broasca” ca 1 gram și „verde”, „broasca verde” ca 2 grame. Executarea acestui lucru peste titluri și numărarea frecvenței fiecărui nivel de grame permite ca conceptele importante să apară.
Apoi am rulat toate ngramele importante printr-un model de limbaj mare (LLM) pentru a vedea cât de bine ar putea alege subiectele importante și să le combinăm în continuare în categorii relevante. Aici vedem limitările LLM-urilor pe subiecte de nișă. Deși modelele au ajutat în acest proces, a existat destul de mult revizuirea manuală a diferitelor ngrame pentru concepte care ar putea construi o categorie.
În plus, există multe entități și concepte precum „Google” și „căutare organică” în setul de date care sunt prezente în multe postări, în timp ce subiecte importante din punct de vedere temporal precum „colibri” durează doar câteva postări și încurcă naibii de modele de limbaj. .
Puteți examina datele categoriei aici și puteți revizui desemnările principale ale categoriilor din graficul de mai jos. Am corelat categoriile cu titlurile utilizând potrivirea sortată inversă a lungimii cuvintelor pentru a ne asigura că frazele mai detaliate sunt potrivite înaintea frazelor mai ample (mai scurte). Este demn de remarcat faptul că am împărțit fiecare subiect într-o categorie largă și o subcategorie mai detaliată.
Graficul de mai jos ( Figura 28 ) conține categoriile largi cu sesiuni peste percentila 25. De asemenea, rețineți că procesul de clasificare este foarte subiectiv. Cu siguranță, spectatorii vor găsi subiecte pe care le-ar fi clasificat diferit.
Datele de link-uri externe și mențiunile instrumentului SEO au fost gestionate prin accesări cu crawlere separate, vizând doar porțiunile fiecărei pagini dedicate conținutului principal.
Datele instrumentului SEO diferă de datele clasificate, deoarece iau în considerare titlul și conținutul. Clasificarea postărilor s-a făcut doar pe titlu.
Datele de tabel, clasificare și istoric (anual) privind vizualizarea de pagină și sesiunea sunt disponibile la Urmărirea datelor de căutare a 20 de ani.
Opiniile exprimate în acest articol sunt cele ale autorului invitat și nu neapărat Search Engine Land. Autorii personalului sunt enumerați aici.