ติดตามการค้นหา 20 ปี

เผยแพร่แล้ว: 2023-08-11

คุณเป็นนักการตลาดการค้นหารายใหม่ที่ต้องการเรียนรู้เกี่ยวกับประวัติการค้นหาหรือไม่

คุณต้องการติดตามข่าวสารล่าสุดเกี่ยวกับการตลาดการค้นหาหรือไม่?

ถ้าเป็นเช่นนั้น มีเพียงคนเดียวที่คุณต้อง "ติดตาม" เพื่อทราบ 90% ของการเปลี่ยนแปลงที่น่าสนใจในอุตสาหกรรม

บุคคลนี้มีเว็บไซต์ บล็อกโพสต์แรกของเขาเผยแพร่เมื่อวันที่ 2 ธันวาคม พ.ศ. 2546 รหัส Google Analytics (GA) ของไซต์นั้นสั้น: UA-67314-1

หลายเดือนก่อน หลังจากการโต้ตอบสั้น ๆ เกี่ยวกับ Mastodon ฉันได้รับสิทธิ์เข้าถึงบัญชี GA ของเขาเพื่อดูว่าฉันสามารถบอกเล่าเรื่องราวเกี่ยวกับประวัติการค้นหาผ่านงานของเขาในฐานะผู้บันทึกการตลาดผ่านการค้นหาได้หรือไม่

เมื่อดูที่รูปแบบการโพสต์ของเขา ( รูปที่ 1 ) จะเห็นได้ชัดว่าปริมาณไม่ใช่ความท้าทาย (ฉันตรวจสอบกราฟนี้ซ้ำหลายครั้งเพื่อให้แน่ใจว่าถูกต้อง ว้าว!)

รูปที่ 1
รูปที่ 1

ในช่วง 20 ปีที่ผ่านมา บุคคลนี้โพสต์โดยเฉลี่ย:

  • 3.81 ครั้งต่อวัน
  • 26.67 ครั้งต่อสัปดาห์
  • 116.20 ครั้งต่อเดือน
  • 1,437 ครั้งต่อปี

ฉันแน่ใจว่าคุณเดาได้ในตอนนี้ แต่ฉันกำลังพูดถึง Barry Schwartz และเว็บไซต์ของเขาที่ชื่อ Search Engine Roundtable

บทความนี้ครอบคลุมประเด็นสำคัญและข้อค้นพบจากการวิเคราะห์ข้อมูล Google Analytics ในอดีตของ seroundtable.com

(หากคุณสนใจวิธีที่ฉันวิเคราะห์ข้อมูลและเครื่องมือที่ฉันใช้ คุณสามารถดูวิธีการด้านล่าง)

ความครอบคลุมของเครื่องมือค้นหาตลอดหลายปีที่ผ่านมา

เนื่องจากเรามีข้อมูลจากปี 2003 และโปสเตอร์จำนวนมาก เราจึงคิดว่าน่าสนใจที่จะดูหัวข้อที่ครอบคลุมซึ่งกล่าวถึงเครื่องยนต์ต่างๆ ในชื่อกระทู้ ( รูปที่ 2 )

รูปที่ 2
รูปที่ 2

ตัวเลขนี้บอกเรื่องราวเดียวกับที่เราทุกคนทราบ Google เป็นเครื่องมือค้นหาที่ครอบคลุมมากที่สุดในสองทศวรรษที่ผ่านมา

แต่ก็น่าสนใจที่จะสังเกตการเสียชีวิตของ Yahoo และการฟื้นคืนชีพของ Microsoft Bing (แม้ว่า Microsoft Bing จะเห็นการครอบคลุมที่เพิ่มขึ้น แต่ก็ไม่ชัดเจนว่าสิ่งนี้ช่วยได้จากมุมมองการใช้งาน ตามที่รายงานในเดือนพฤษภาคม)

มองในมุมของคนๆ หนึ่ง ครอบคลุม “ความน่าสนใจ” ของผลิตภัณฑ์เหล่านี้เป็นวิธีที่ไม่เหมือนใครในการทำความเข้าใจประวัติของพวกเขา

โดยเฉพาะอย่างยิ่ง เสิร์ชเอ็นจิ้นหลักๆ ของสหรัฐฯ ส่วนใหญ่ได้รับการกล่าวถึงน้อยที่สุดในช่วง 13 ปีที่ผ่านมา ยกเว้น Microsoft Bing ซึ่งเพิ่งได้รับความนิยมอย่างกะทันหันเนื่องจากการผสานรวมของ Microsoft กับ OpenAI

เมื่อพิจารณาจากจำนวนเซสชันเฉลี่ยต่อโพสต์และความถี่ในการโพสต์เมื่อเวลาผ่านไปโดยกลุ่มเครื่องมือค้นหา ( รูปที่ 2 ) เป็นที่ชัดเจนว่าข่าวที่ครอบคลุมมีส่วนอย่างมากต่อความสำคัญของ Google สำหรับผู้ชมไซต์นี้

ส่วนที่สำคัญอย่างหนึ่งของเครื่องมือค้นหาคือความถี่ในการปรับปรุงผลลัพธ์ เราสามารถย้อนดูประวัติของ "การอัปเดตอัลกอริทึม" ที่ครอบคลุมพร้อมกับปริมาณการค้นหาที่ขับเคลื่อนในแต่ละเดือน

คุณจะสังเกตเห็นว่าโพสต์เพิ่มขึ้นอย่างไร หลังจาก ปริมาณการเข้าชมเพิ่มขึ้นในช่วงแรกด้วยการประกาศอัปเดต กราฟด้านล่างแสดงเรื่องราวที่น่าสนใจของ:

  • การอัปเดตบ่อยเพียงใด (อย่างน้อยรายการหลัก)
  • ความเชื่อมโยงของ Schwartz และความสอดคล้องของการรายงานข่าวของเขา
รูปที่ 3
รูปที่ 3

ผลกระทบและความนิยมของการอัปเดตของ Google ในชุมชนการค้นหา

เราติดป้ายกำกับการอัปเดต Google ที่มีชื่อประมาณ 20 รายการ แปดรายการด้านล่างคือแปดอันดับแรกตามเซสชันโดยรวม ( รูปที่ 4 ) เราได้เพิ่มหมวดหมู่ "จุดโทษ" ลงในแผนภูมินี้ เนื่องจากเป็นหัวข้อที่มาแรงในยุคเพนกวิน

ในขณะที่หัวข้อยังคงมีการกล่าวถึง แต่ความนิยมก็ลดลงดังที่แสดงด้านล่าง สิ่งนี้แสดงให้เห็นถึงผลกระทบอย่างมากของการอัปเดต Penguin ในชุมชนการค้นหา

รูปที่ 4
รูปที่ 4

ที่น่าสนใจคือ seroundtable.com มีการดำเนินการโดยเจ้าหน้าที่จาก Google ตั้งแต่ปี 2550 ถึงมีนาคม 2556

Schwartz เขียนเกี่ยวกับเรื่องนี้ในปี 2011 และเราสามารถเห็นคำอธิบายประกอบในบัญชี GA ของเขาที่ระบุว่ามีการยกออกในเดือนมีนาคมและยืนยันการยกผ่านคำขอให้พิจารณาใหม่ในเดือนเมษายน

การเติบโตของเซสชัน Google/Organic (YoY) ในไตรมาสที่ 1 ปี 2013 อยู่ที่ 16% เทียบกับ 25% ในไตรมาสที่ 2 ( รูปที่ 5 )

การเติบโตของผู้ใช้ใหม่เพิ่มขึ้น 22 เปอร์เซ็นต์ แม้จะมีสิ่งนี้ ผลกระทบนั้นยังน่าสงสัยเนื่องจากดอกเบี้ยพุ่งสูงผิดปกติซึ่งเอื้อประโยชน์ต่อไตรมาสที่สอง

รูปที่ 5
รูปที่ 5

Schwartz จากโพสต์ของเขาเกี่ยวกับจุดโทษ (และลิงก์ผู้สนับสนุนของเขา) กล่าวว่า:

  • “ฉันดื้อรั้นและฉันเป็นหนึ่งในบล็อก SEO ไม่กี่แห่งที่ตัดสินใจไม่เปลี่ยนแปลงเมื่อ Google ปล่อยการลงโทษ”

หลายปีต่อมา เขาได้พิจารณาอีกครั้ง (ตอนนี้รายละเอียดหลายอย่างขาดหายไปใน GA แต่การลงโทษด้วยตนเองน่าจะไม่มีผลกระทบรุนแรง)

Seroundtable.com ก็ตกเป็นเหยื่อของการอัพเดท Panda 4.1 ในปี 2014 ( รูปที่ 6 )

ตามที่ Schwartz ระบุในปี 2015 ประสิทธิภาพเริ่มดีขึ้นเล็กน้อยด้วย Panda 4.2 ในช่วงกลางปี ​​2015 จนถึงเดือนพฤษภาคม 2020 ซึ่งมีการลดลงอย่างกะทันหันอีกครั้ง

รูปที่ 6
รูปที่ 6

สมาชิกในทีม Google

เราพบพนักงาน Google 10 คนที่กล่าวถึงในชื่อโพสต์ ( รูปที่ 7 )

จาก 10 รายการ เราจำกัดรายการให้แสดงเฉพาะข้อมูลที่มีการสื่อสารเป็นประจำกับชุมชน SEO

นี่เป็นมุมมองที่ฉันชอบเพราะมันแสดงให้เห็นอย่างชัดเจนระหว่างยุคของ Matt Cutts กับ John Mueller

ในฐานะผู้ประสานงานสาธารณะสำหรับ Google Search แดนนี่ ซัลลิแวนไม่เด่นชัดในโพสต์ สิ่งสำคัญคือต้องทราบว่าการกล่าวถึงเขาก่อนปลายปี 2560 จะหมายถึงบทบาทก่อนหน้าของเขาก่อนที่จะเข้ารับตำแหน่งนี้

ในฐานะผู้ก่อตั้ง Search Engine Watch และต่อมาเป็นบรรณาธิการผู้ก่อตั้ง Search Engine Land ซัลลิแวนเป็นส่วนสำคัญของประวัติศาสตร์ SEO อย่างไม่ต้องสงสัย

รูปที่ 7
รูปที่ 7

ความครอบคลุมของเครื่องมือ SEO

อุตสาหกรรม SEO ไม่มีปัญหาการขาดแคลนเครื่องมือ จากการตรวจสอบโพสต์ของ Schwartz เราจะเห็นว่าเขาได้กล่าวถึงบริษัทเครื่องมือต่างๆ มากมายในช่วงหลายปีที่ผ่านมา

แม้ว่าโพสต์ที่อุทิศให้กับบริษัทใดบริษัทหนึ่งจะค่อนข้างหายาก แต่ Schwartz ได้ครอบคลุมถึงการศึกษาข้อมูลและการประกาศเกี่ยวกับผลิตภัณฑ์

ด้านล่าง ( รูปที่ 8ก ) เราจะเห็นความถี่ของการรายงานข่าวในโพสต์ตั้งแต่ปี 2003 ข้อมูลนี้แตกต่างจากข้อมูลอื่นในบทความนี้เนื่องจากพิจารณาถึงการกล่าวถึงในชื่อบทความและเนื้อหา

ชื่อเครื่องมือ กล่าวถึงนับ
โมซ 924
อันดับแรนเจอร์ 561
แอคคูแรนเกอร์ 297
อัลโกรู 292
อันดับเว็บขั้นสูง 289
SEO ความรู้ความเข้าใจ 232
SERPmetrics 116
ยีสต์ 91
มาเจสติก 53
SERPs.com 46
SEMrush 44
กบร้อง 34
อาเรฟ 29
ซิทริกซ์ 21
ลึกคลาน 20
เว็บที่คล้ายกัน 13
การจัดอันดับ SE 12
ฮาโร 9
สถานะ SERP 7
SERPWoo 6
รูปที่ 8a

ในอดีต เราสามารถเห็นประโยชน์จากผู้ขายเครื่องมือในการสร้างเมตริกการจัดอันดับแบบรวม เช่น Mozcast

การกล่าวถึงบ่อยครั้งและเพิ่มขึ้นตามความผันผวนของการจัดอันดับแต่ละครั้ง นอกจากนี้ยังเป็นที่ชัดเจนเกี่ยวกับพลังแห่งการเข้าพักที่ Moz มี

รูปที่ 8b
รูปที่ 8b

โพสต์ยอดนิยม

ตารางต่อไปนี้ ( รูปที่ 9 ) แสดงโพสต์ยอดนิยมในแต่ละปีตามการเปิดดูหน้าเว็บที่ไม่ซ้ำกัน

มีเนื้อหาที่ดึงดูดความสนใจในวงกว้าง (นอกชุมชน SEO) และเนื้อหาที่กำหนดเป้าหมายไปยังนักการตลาดผ่านเครื่องมือค้นหาอย่างแคบลง

ฉันสงสัยว่าเขาตัดสินความสมดุลนี้อย่างไร ฉันรู้สึกประหลาดใจเล็กน้อยกับรายการนี้ แต่ก็สมเหตุสมผล

ปี ชื่อ การดูหน้าเว็บที่ไม่ซ้ำ
2548 การขอแต่งงานครั้งแรกผ่านเครื่องมือค้นหา 3,568
2549 Google Earth – ดาวน์โหลดฟรี 50,669
2550 Google Earth – ดาวน์โหลดฟรี 44,214
2551 Google Earth – ดาวน์โหลดฟรี 64,097
2552 การหลอกลวง: ระบบ Google Money หรือ Google Kit 88,657
2553 วิธีตั้งค่าหน่วยวิดีโอ Google AdSense ผ่าน YouTube 78,537
2554 วิธีตั้งค่าหน่วยวิดีโอ Google AdSense ผ่าน YouTube 148,083
2555 Google ฉลองโรงภาพยนตร์ไดรฟ์อินแห่งแรก 126,629
2556 Google Maps ฆาตกรรมที่ 52.376552,5.198303 ในเนเธอร์แลนด์ 265,977
2557 Google Maps ฆาตกรรมที่ 52.376552,5.198303 ในเนเธอร์แลนด์ 110,222
2558 Google Analytics เปลี่ยนคำศัพท์: เซสชัน & ผู้ใช้แทนที่การเข้าชม & ไม่ซ้ำ 68,565
2559 วิธีรับลองจิจูด/ละติจูดของสถานที่โดยใช้ Google Maps บน iPhone 129,300
2560 Big Google Algorithm Fred Update ดูเหมือนลิงค์ที่เกี่ยวข้อง 175,488
2561 ตอนนี้คุณสามารถเลือกที่จะลบการค้นหาที่กำลังมาแรงใน Google Search App 125,922
2019 ตอนนี้คุณสามารถเลือกที่จะลบการค้นหาที่กำลังมาแรงใน Google Search App 181,556
2563 โลโก้ Google กล่าวขอบคุณผู้ช่วยเหลือ Coronavirus 413,202
2021 ตอนนี้คุณสามารถเลือกที่จะลบการค้นหาที่กำลังมาแรงใน Google Search App 103,498
2022 การอัปเดตเนื้อหาที่เป็นประโยชน์ของ Google เพื่อกำหนดเป้าหมายเนื้อหาที่เขียนขึ้นสำหรับการจัดอันดับการค้นหา 226,842
2023 Google Maps ฆาตกรรมที่ 52.376552,5.198303 ในเนเธอร์แลนด์ 55,533

รูปที่ 9

ความคิดเห็น

เท่าที่ฉันรู้ Seroundtable.com อนุญาตให้แสดงความคิดเห็นได้เสมอ และชุมชน SEO ชอบที่จะแบ่งปันความคิดเห็นเกี่ยวกับเล่ห์เหลี่ยมของ Google

มุมมองนี้ ( รูปที่ 10 ) แนะนำโดย John Mueller แสดงโพสต์เมื่อเวลาผ่านไปตามจำนวนการดูหน้าเว็บและความคิดเห็นที่ไม่ซ้ำกัน (ขนาดฟอง)

รูปที่ 10
รูปที่ 10

สิ่งนี้น่าสนใจหากเราดูข้อมูลตามหมวดหมู่หัวข้อ

ตัวอย่างเช่น ลองเปรียบเทียบเนื้อหาใน “Google Updates” กับเนื้อหาใน “โฆษณาที่เสียค่าใช้จ่าย” ( รูปที่ 11a และ 11b )

รูปที่ 11a
รูปที่ 11a
รูปที่ 11b
รูปที่ 11b

มันร้อนน้อยกว่าฝั่งที่จ่ายเงินมาก แต่มันแสดงให้เห็นถึงระดับความสนใจ อารมณ์ และการโต้ตอบที่เพิ่มขึ้นสำหรับโพสต์ที่ครอบคลุมการเปลี่ยนแปลงที่อาจลบล้างความพยายามหลายเดือนหรือหลายปี

ลิงค์

Schwartz ไม่อายที่จะเชื่อมโยงกับคนอื่น

ดังที่ได้กล่าวไว้ก่อนหน้านี้ Schwartz ลังเลที่จะเพิ่มแอตทริบิวต์ nofollow ในลิงก์ผู้สนับสนุนหลายปีหลังจากได้รับโทษเล็กน้อยจาก Google ในปี 2550

Schwartz ได้เชื่อมโยงจากเนื้อหาโพสต์ของเขากับโดเมนที่ไม่ซ้ำกันเกือบ 4,000 โดเมนในช่วง 20 ปีที่ผ่านมา ( รูปที่ 12 )

กราฟนี้แสดงโดเมนที่เชื่อมโยง 10 อันดับแรกจากชุดข้อมูล ซึ่งแสดงให้เห็นอย่างชัดเจนถึงคุณค่าที่ Twitter มอบให้กับ Schwartz ในการค้นหาข้อมูลเพื่อเขียนเกี่ยวกับในช่วง 10 ปีที่ผ่านมา

รูปที่ 12
รูปที่ 12

แผนภูมิถัดไปลบ Twitter และ Google และทำสิ่งเดียวกัน ( รูปที่ 13 )

เราเริ่มเห็นบางเว็บไซต์ที่นัก SEO รุ่นใหม่อาจไม่รู้จัก แต่หลายคนอาจจำได้ด้วยระดับความชื่นชอบที่แตกต่างกันไป

รูปที่ 13
รูปที่ 13

รับจดหมายข่าวรายวันที่นักการตลาดไว้วางใจ

กำลังดำเนินการ...โปรดรอสักครู่

ดูข้อกำหนด


การแสดงข้อมูลของแนวโน้มการค้นหาเมื่อเวลาผ่านไป

นี่คือแผนภูมิแท่งการแข่งรถที่สนุกสนานซึ่งแสดงหมวดหมู่ยอดนิยมในช่วง 20 ปีที่ผ่านมา ( รูปที่ 14 ) สิ่งนี้ทำหน้าที่เป็นเครื่องเตือนใจถึงความตื่นตระหนกที่หลั่งไหลเข้ามาในชุมชน SEO ระหว่างการอัปเดตของ Google

สิ่งนี้นำมาซึ่งความสะดวกสบายในระดับหนึ่ง เนื่องจากแม้ว่า SEO จะเปลี่ยนแปลงอย่างรวดเร็ว แต่ก็เป็นเช่นนั้นเสมอมา

รูปที่ 14

รูปที่ 14 ( ดูแอนิเมชั่นเต็มได้ ที่นี่ )

Schwartz โพสต์เหมือนหุ่นยนต์

ฉันคิดว่าบางสิ่งที่น่าสนใจที่นี่สามารถใช้เพื่อชี้ว่าวันใดมีความสำคัญสำหรับการโพสต์ แต่ไม่ใช่

การโพสต์แบบที่มันเกิดขึ้นและมันเกิดขึ้นมากมาย

ฉันพูดถึงว่าชวาร์ตษ์เป็นหุ่นยนต์ที่อาศัยความสม่ำเสมอที่ไม่ธรรมดาที่เขาแสดงให้เห็นในการโพสต์ในช่วงหลายปี

ฉันมีความยากลำบากในการทำโปรเจกต์เดียวกันมานานกว่าหกเดือน ดังนั้น 20 ปีจึงเกินความคาดหมาย ( รูปที่ 15 )

รูปที่ 15
รูปที่ 15

เพื่อความสมดุล นี่คือจำนวนเซสชันตามวันในสัปดาห์ ( รูปที่ 16 ) ฉันคิดว่ามันไม่สำคัญแม้ว่ากลางสัปดาห์จะเป็นผู้ชนะที่ชัดเจน

รูปที่ 16
รูปที่ 16

เมื่อพิจารณาประเภทของโพสต์ที่เผยแพร่ในช่วงหลายปีที่ผ่านมา ดูเหมือนว่าจะไม่มีความแตกต่างกันมากนักระหว่างประเภทของโพสต์ในวันธรรมดา ( รูปที่ 17 )

ที่เราเห็นความแตกต่างคือวันเสาร์และวันอาทิตย์ ซึ่งเป็นวันที่มักจะเกี่ยวข้องกับเหตุการณ์ทางโลกที่มีความสำคัญอย่างยิ่ง

Schwartz ไม่ค่อยโพสต์ในวันเสาร์และอาทิตย์ โดย 0.74% และ 0.17% ของโพสต์ทั้งหมดตามลำดับ

สิ่งนี้สมเหตุสมผลโดยสัญชาตญาณเพราะเขามักจะหยุดพักจากวันหยุดสุดสัปดาห์เพื่อซื้อของที่สำคัญจริงๆ

รูปที่ 17
รูปที่ 17

หมวดหมู่ที่สำคัญและจำนวนคำ

เหล่านี้เป็นหมวดหมู่อันดับต้น ๆ จากหมวดหมู่ที่ได้รับการตรวจสอบตามความชัน ( รูปที่ 18 ) สำหรับการอ้างอิง ความชันคือการวัดที่อธิบายทิศทางและความชันของเส้น

เหตุผลหนึ่งที่หมวดหมู่เหล่านี้ทำงานได้ดีมากจากมุมมองของการเข้าชมอาจเป็นเพราะเนื้อหาประเภทนี้แตกออกจากฟองสบู่โลก SEO ทั่วไปและเข้าสู่กลุ่มประชากรทั่วไปที่สนใจใน Google

รูปที่ 18
รูปที่ 18

ชวาร์ตษ์มักกล่าวว่าเขาสนใจเกี่ยวกับการเผยแพร่ข่าวมากกว่าความลึกของข่าว

สิ่งนี้ได้รับการสนับสนุนโดยข้อมูลเมื่อดูความสัมพันธ์ระหว่างเซสชันและจำนวนคำ ( รูปที่ 19 )

รูปที่ 19
รูปที่ 19

จำนวนผู้อ่านของ Schwartz สะท้อนถึงอุตสาหกรรม SEO และความสนใจในกลุ่มต่างๆ อย่างไร

ส่วนย่อยของ SEO

นี่คือที่ที่หมวดหมู่อาจทำให้ฉันมีปัญหา

ในระดับสูง นี่คือความสนใจที่เกี่ยวข้องในอุตสาหกรรม SEO สำหรับผู้ติดตามและผู้อ่านของ Schwartz สำหรับสี่ส่วนหลัก ๆ ของ SEO ( รูปที่ 20 )

ตามที่ Mueller ชี้ให้เห็น คุณจะเห็นทศวรรษของมือถือได้อย่างสวยงาม

รูปที่ 20
รูปที่ 20

AI และ SEO

ตกลง ฉันแค่ต้องการทำทรีแมป แต่นี่เป็นมุมมองที่ยอดเยี่ยมของเซสชันทั้งหมดตามโพสต์จากหมวด "การเรียนรู้ของเครื่อง" ( รูปที่ 21 )

โปรดทราบว่านี่คือเซสชันทั้งหมดของโพสต์ที่ดีที่สุดในแต่ละหมวดหมู่ สิ่งนี้ควรควบคุมความใหม่ที่เกี่ยวข้องของบางหมวดหมู่

ฉันพบว่ามันน่าทึ่งที่การเข้าสู่ศัพท์ของ BERT มีผลกระทบมากกว่าการเปลี่ยนแปลงของแมชชีนเลิร์นนิงล่าสุด

รูปที่ 21
รูปที่ 21

ฮีโร่ SEO

สำหรับกูรูในเพจทุกท่าน นี่คือระดับความสนใจเชิงเปรียบเทียบสำหรับสมาชิกของหมวดหมู่นี้ โดยพิจารณาจากเซสชันของโพสต์ที่มีประสิทธิภาพดีที่สุด ( รูปที่ 22 )

โปรดทราบว่า "Meta" อาจสูงเกินจริงเนื่องจากการจับคู่กับบริษัท Meta (Facebook)

รูปที่ 22
รูปที่ 22

นี่คือหมวดหมู่ยอดนิยมตามชั้นเชิง ( รูปที่ 23 ) เนื่องจากเป็นเวลากว่า 20 ปีแล้ว กลวิธีเหล่านี้จำนวนหนึ่งอาจทำให้เว็บไซต์ถูกลงโทษได้

สิ่งนี้แสดงให้เห็นได้ดีถึงอดีตที่ผ่านมาของ SEO และธรรมชาติของ PR ของ Google ผลักดันให้ใช้กลยุทธ์ที่พยายามหลอกล่อระบบของพวกเขาหรือทำร้ายผู้อื่น

รูปที่ 23
รูปที่ 23

จ่าย

สำหรับเพื่อนของฉันที่จ่ายเงิน นี่คือสมาชิกของกลุ่มโพสต์ "โฆษณาที่เสียค่าใช้จ่าย" ( รูปที่ 24 ) ใครจำ Overture ได้บ้าง?

รูปที่ 24
รูปที่ 24

เบราว์เซอร์

สิ่งนี้น่าประหลาดใจสำหรับฉันเมื่อพิจารณาจากปริมาณของ Google ที่ครอบคลุมในเว็บไซต์นี้และส่วนแบ่งการตลาดของ Google ที่ไม่สมดุล (62.85%) แต่ Schwartz ให้ความครอบคลุมเท่ากัน ( รูปที่ 25 )

รูปที่ 24
รูปที่ 25

เหตุการณ์

โพสต์ก่อนหน้านี้ในประวัติศาสตร์บางรายการส่งเสริมการประชุมเฉพาะอย่างเช่น SMX แต่นี่เป็นช่วงเวลาที่ค่อนข้างสั้น ดังนั้นพวกเขาจึงถูกลบออกจากชุดข้อมูล

สิ่งที่น่าสนใจคือ เนื้อหาเกี่ยวกับโควิด-19 ที่โดดเด่น ซึ่งกินเวลาประมาณหนึ่งปี เปรียบเทียบกับหมวดหมู่อื่นๆ ในช่วง 20 ปี ( รูปที่ 26 )

นอกจากนี้ เราต้องการไข่อีสเตอร์เพิ่มเติมจาก Google อย่างแน่นอน Schwartz บอกฉันว่าเขาเคยทำกิจกรรมสดบนบล็อก แต่หยุดไปเมื่อทศวรรษที่แล้ว

ฉันลบชื่อเรื่องส่วนใหญ่ (ทั้งหมด?) ออกจากชุดข้อมูลที่อย่างน้อยมีการกล่าวถึงหัวข้อที่เกี่ยวข้อง (เช่น vlog ตอนที่ #1234 Weekly Roundup เป็นตัวอย่างของรายการที่จะถูกลบออก)

Schwartz ยังกล่าวอีกว่าเขาเลิกปกปิดโลโก้ Google เมื่อผู้เผยแพร่รายอื่นเริ่มปกปิด

“พวกเขาสูญเสียความสนุกไป”

มันเจ๋งแค่ไหนที่จะทำบางสิ่งที่ขับเคลื่อนด้วยความหลงใหลและไม่ใช่การคลิก?

รูปที่ 26
รูปที่ 26

ประวัติการค้นหาใน 32,926 โพสต์และเพิ่มขึ้นเรื่อย ๆ

หน้าผู้เขียนของ Barry Schwartz บน Search Engine Roundtable
หน้าผู้เขียนของ Barry Schwartz บน Search Engine Roundtable โดยมีบทความ 32,926 บทความที่เผยแพร่ในขณะที่เขียน

เป็นเรื่องน่าสนใจที่จะย้อนกลับไปเล่าถึงการเปลี่ยนแปลงทั้งหมดในอุตสาหกรรมและทำความรู้จักกับวันแห่งการค้นหา "ป่าตะวันตก"

และเราต้องขอบคุณ Barry Schwartz สำหรับ 20 ปีที่ดูแลอุตสาหกรรมนี้อย่างไม่ขาดตกบกพร่อง

หากเกี่ยวข้องกับการตลาดผ่านการค้นหา เราทราบดีว่า Schwartz มีส่วนรู้เห็นหรือครอบคลุมมากกว่า

นั่นไม่ใช่เรื่องใหม่

ฉันอยากจะขอบคุณ John Mueller และ Patrick Stox สำหรับคำแนะนำและการตรวจสอบสุขภาพจิตของพวกเขาเกี่ยวกับข้อมูลและข้อมูลที่ให้ไว้ที่นี่ Danny Sullivan เข้ารับการตรวจสุขภาพเพิ่มเติม

ข้อมูลและวิธีการ

ฉันเริ่มต้นด้วยการรวบรวมข้อมูล seroundtable.com ใน Screaming Frog ค่อยๆ ดึงเนื้อหาเมตาของโพสต์ เช่น ผู้แต่ง วันที่โพสต์ และหมวดหมู่ โดยใช้การแยกแบบกำหนดเอง ฉันดึงข้อมูล GA มาด้วย แม้ว่านี่จะเป็นข้อมูลตั้งแต่ปี 2005 ฉันรู้ว่านี่ยังไม่เพียงพอ ข้อมูล HTML ถูกส่งออกเป็น CSV เพื่อการประมวลผลต่อไป

เนื่องจากมีผู้เขียนหลายคนใน seroundtable.com ฉันจึงจำกัดการวิเคราะห์ที่เหลือไว้เฉพาะโพสต์ที่เขียนโดย Schwartz เท่านั้น (เขาเขียนมากกว่า 32,000 รายการ)

เพื่อให้เข้าใจได้ดีขึ้นว่า Schwartz มีส่วนร่วมกับเว็บไซต์มากน้อยเพียงใด ต่อไปนี้คือภาพรวมโดยย่อของผู้เขียน 10 อันดับแรกและจำนวนบทความที่เกี่ยวข้องกับพวกเขา ( รูปที่ 27 )

ผู้เขียน บทความ
แบร์รี่ ชวาร์ตษ์ 32,786
ทามาร์ ไวน์เบิร์ก 1,875
เบน ไฟเฟอร์ 351
คริส บ็อกส์ 246
cre8pc 119
ดิจิตอลพอยท์ 40
นาโช 34
ลิงเขียวชั่วร้าย 24
ไอ้ซอ 22
เชล 21
รูปที่ 27

จากนั้นฉันก็ตั้งค่าการดึง API จาก GA API เพื่อดึงหน้า Landing Page และเซสชันรายเดือนสำหรับผู้ใช้ทั้งหมด นอกจากนี้ เราดึงข้อมูลการดูหน้าเว็บและลิงก์ภายนอก

หลังจากดึงข้อมูลทั้งหมดแล้ว ฉันสังเกตเห็นว่า seroundtable.com ใช้ AMP ซึ่งหมายถึง URL สองชุดสำหรับบทความจำนวนมาก การดูทาก (เช่น/category/this-is-a-slug.html) โชคดีที่สิ่งเหล่านี้ล้วนมีเอกลักษณ์เฉพาะตัว

ฉันจำเป็นต้องกำจัดหมวดหมู่ หน้าผู้แต่ง และหน้าอื่นๆ ที่หัวข้อไม่สามารถอธิบายได้จากชื่อเรื่อง – จำกัดเฉพาะที่ Screaming Frog พบผู้แต่งได้อย่างง่ายดาย

จากตรงนั้น ฉันทำความสะอาดเส้นทาง URL ให้เป็นทากที่ไม่ซ้ำใคร และใช้สิ่งนั้นเป็นการจับคู่ระหว่างข้อมูล URL ที่รวบรวมข้อมูลและข้อมูล GA

เป็นที่น่าสังเกตว่าข้อมูล seroundtable.com เริ่มต้นใน GA ในไตรมาสที่ 4 ของปี 2548 โพสต์แรกมาจากไตรมาสที่ 4 ของปี 2546 ตามที่ Patrick Stox ชี้ให้เห็น วันที่ 14 พฤศจิกายน 2548 เป็นการเปิดตัวอย่างเป็นทางการของ GA ซึ่งหมายถึง ข้อมูลของเราครอบคลุมข้อมูลทั้งหมดผ่านการเกิดและการตายของ GA ตามที่เราทุกคนทราบ

ก่อนหน้านี้ ไซต์ใช้ Urchin Analytics ซึ่งกลายมาเป็น GA จากทากที่ไม่ซ้ำกัน 27,309 ชนิดที่พบในการรวบรวมข้อมูล มีเพียง 0.2% เท่านั้นที่ไม่พบในข้อมูล GA ส่วนใหญ่เกิดขึ้นหลังจากการตัดข้อมูลในวันที่ 30 มิถุนายน 2023

การประมวลผลภาษาธรรมชาติ (NLP)

หลังจากแน่ใจว่าฉันมีข้อมูลหน้าเว็บและข้อมูล Analytics ที่สะอาดแล้ว ฉันเรียกใช้ชื่อหน้าผ่านกระบวนการที่เปลี่ยนให้เป็น ngrams ngram คือการจัดกลุ่ม n-term ตัวอย่างเช่น "กบสีเขียว" จะประกอบด้วย: "the" "สีเขียว" "กบ" เป็น 1 กรัม และ "สีเขียว" "กบสีเขียว" เป็น 2 กรัม การเรียกใช้สิ่งนี้เหนือชื่อเรื่องและการนับความถี่ของแต่ละระดับกรัมทำให้แนวคิดที่สำคัญปรากฏขึ้น

จากนั้นเรารัน ngrams ที่สำคัญทั้งหมดผ่านโมเดลภาษาขนาดใหญ่ (LLM) เพื่อดูว่ามันสามารถเลือกหัวข้อที่สำคัญและรวมเข้ากับหมวดหมู่ที่เกี่ยวข้องได้ดีเพียงใด นี่คือจุดที่เราเห็นข้อจำกัดของ LLM ในหัวข้อเฉพาะ แม้ว่าโมเดลจะช่วยในกระบวนการนี้ แต่ก็มีการตรวจสอบ ngrams ต่างๆ ด้วยตนเองเล็กน้อยสำหรับแนวคิดที่สามารถสร้างหมวดหมู่ได้

นอกจากนี้ ยังมีเอนทิตีและแนวคิดมากมาย เช่น "Google" และ "การค้นหาทั่วไป" ในชุดข้อมูลที่ปรากฏในโพสต์จำนวนมาก ในขณะที่หัวข้อสำคัญชั่วคราวอย่าง "นกฮัมมิ่งเบิร์ด" จะอยู่เพียงไม่กี่โพสต์เท่านั้น และสร้างความสับสนให้กับรูปแบบภาษา .

คุณสามารถตรวจสอบข้อมูลหมวดหมู่ได้ที่นี่ และตรวจสอบการกำหนดหมวดหมู่หลักในกราฟด้านล่าง เราจับคู่หมวดหมู่กับชื่อเรื่องโดยใช้การจับคู่แบบเรียงคำและความยาวแบบย้อนกลับเพื่อให้แน่ใจว่าวลีที่มีรายละเอียดมากขึ้นจะจับคู่ก่อนวลีที่กว้างกว่า (สั้นกว่า) เป็นที่น่าสังเกตว่าเราแบ่งแต่ละหัวข้อออกเป็นหมวดหมู่กว้างๆ และหมวดหมู่ย่อยที่มีรายละเอียดมากขึ้น

กราฟด้านล่าง ( รูปที่ 28 ) ประกอบด้วยหมวดหมู่กว้างๆ ที่มีเซสชันสูงกว่าเปอร์เซ็นไทล์ที่ 25 โปรดทราบว่ากระบวนการจัดหมวดหมู่นั้นเป็นเรื่องส่วนตัว มาก เพื่อความแน่ใจ ผู้ชมจะพบหัวข้อที่พวกเขาต้องการจัดหมวดหมู่แตกต่างกัน

รูปที่ 28
รูปที่ 28

ข้อมูลลิงก์ภายนอกและการกล่าวถึงเครื่องมือ SEO ได้รับการจัดการผ่านการรวบรวมข้อมูลแยกต่างหากที่กำหนดเป้าหมายเฉพาะส่วนของแต่ละหน้าที่อุทิศให้กับเนื้อหาหลัก

ข้อมูลเครื่องมือ SEO แตกต่างจากข้อมูลที่จัดหมวดหมู่เนื่องจากพิจารณาจากชื่อเรื่อง และ เนื้อหา การจัดหมวดหมู่ของโพสต์ทำได้โดยใช้ชื่อเท่านั้น

ตาราง การจัดหมวดหมู่ และข้อมูลประวัติการดูหน้าเว็บและเซสชันย้อนหลัง (รายปี) มีอยู่ในการติดตามข้อมูลการค้นหา 20 ปี


ความคิดเห็นที่แสดงในบทความนี้เป็นความคิดเห็นของผู้เขียนรับเชิญและไม่จำเป็นต้องเป็น Search Engine Land ผู้เขียนเจ้าหน้าที่อยู่ที่นี่