งบประมาณการรวบรวมข้อมูลคืออะไร [และจะเพิ่มประสิทธิภาพได้อย่างไร]
เผยแพร่แล้ว: 2022-05-16งบประมาณการรวบรวมข้อมูลเป็นหนึ่งในเงื่อนไข SEO ที่คุณอาจเคยได้ยินที่คนการตลาดพูดถึง
อย่างไรก็ตาม คุณรู้ไหมว่ามันหมายถึงอะไร และมันเกี่ยวกับอะไร?
ไม่ต้องกังวล เราไม่ได้อยู่ที่นี่เพื่อทดสอบคุณ ในทางกลับกัน เราพร้อมช่วยให้คุณเข้าใจทุกอย่างเกี่ยวกับงบประมาณการรวบรวมข้อมูล เหตุใดจึงสำคัญ และวิธีที่คุณสามารถตรวจสอบและเพิ่มประสิทธิภาพงบประมาณได้
ท้ายที่สุดคุณต้องเรียนรู้ที่จะคลานก่อนที่จะเดินได้ใช่ไหม
งบประมาณการรวบรวมข้อมูลคืออะไร?
งบประมาณการรวบรวมข้อมูลคือจำนวนหน้าที่ Google สามารถรวบรวมข้อมูลบนเว็บไซต์ภายในระยะเวลาที่กำหนด
คุณเห็นไหมว่าทุกครั้งที่คุณเผยแพร่หน้าบนเว็บไซต์ของคุณ คุณต้องรอให้ Google จัดทำดัชนีและจัดอันดับ และเพื่อให้สามารถทำเช่นนั้นได้ โรบ็อตของหน้าเว็บจะต้องรวบรวมข้อมูลก่อน
กระบวนการนี้อาจเกิดขึ้นเร็วขึ้นหรือช้าลงขึ้นอยู่กับสถานการณ์ เช่น เว็บไซต์ของคุณมีขนาดใหญ่เพียงใด หัวข้อที่ได้รับความนิยม การเข้าชมหน้าเว็บของคุณมีมากเพียงใด เป็นต้น
แต่การรวบรวมข้อมูลจริงทำงานอย่างไร
ลองหากัน
โปรแกรมรวบรวมข้อมูลทำงานอย่างไร
กว่า 10 ปีที่แล้ว Google ตระหนักว่าพวกเขามีทรัพยากรที่จำกัด และสามารถค้นหาเนื้อหาออนไลน์ที่ไม่มีวันสิ้นสุดได้ในเปอร์เซ็นต์ที่จำกัดซึ่งได้รับการเผยแพร่ทางออนไลน์อย่างต่อเนื่อง
จากนั้นในปี 2560 Google ได้เผยแพร่บทความอย่างเป็นทางการว่า "งบประมาณการรวบรวมข้อมูลมีความหมายอย่างไรสำหรับ Googlebot" ซึ่งอธิบายคำจำกัดความของการรวบรวมข้อมูลและรายละเอียดอื่นๆ ที่เกี่ยวข้อง
นี่คือข้อเท็จจริงที่สำคัญ:
- การรวบรวมข้อมูลมีประสิทธิภาพ เว้นแต่เว็บไซต์ของคุณมี URL มากกว่าสองสามพันรายการ
- หน้าตอบสนองอย่างรวดเร็วเพิ่มขีดจำกัดการรวบรวมข้อมูล
- คุณสามารถลดอัตราการรวบรวมข้อมูลเว็บไซต์ของคุณผ่าน Google Search Console
- URL ยอดนิยมมักจะถูกรวบรวมข้อมูลบ่อยขึ้น
- URL ที่มีมูลค่าต่ำจำนวนมาก (เนื้อหาที่ซ้ำกัน หน้าข้อผิดพลาดแบบซอฟต์ ฯลฯ) อาจส่งผลเสียต่อการจัดทำดัชนีและการรวบรวมข้อมูล
- การรวบรวมข้อมูลไม่ใช่ปัจจัยการจัดอันดับโดยตรง
โดยพื้นฐานแล้ว คุณจะต้องมีเวลาโหลดที่รวดเร็ว หลีกเลี่ยงเนื้อหาที่ซ้ำกันและมีคุณภาพต่ำ และทำให้หน้าเว็บของคุณเป็นที่นิยม
อย่างไรก็ตาม สิ่งสำคัญที่ควรทราบคือเจ้าของเว็บไซต์ส่วนใหญ่ไม่จำเป็นต้องกังวลเกี่ยวกับงบประมาณในการรวบรวมข้อมูลมากเกินไป เป็นเว็บไซต์ขนาดใหญ่ที่มีหน้าหลายพันหน้า เช่น ร้านค้าอีคอมเมิร์ซ สิ่งพิมพ์ดิจิทัล และบล็อกยอดนิยมที่ควรให้ความสนใจ
เหตุใดงบประมาณการรวบรวมข้อมูลจึงมีความสำคัญ
งบประมาณการรวบรวมข้อมูลมีความสำคัญมากต่อความพยายามในการทำ SEO ของคุณ โดยเฉพาะอย่างยิ่งเมื่อคุณมีหน้าหลายพันหน้าและเผยแพร่บทความใหม่ๆ เป็นประจำทุกวัน บอทจะต้องการรวบรวมข้อมูลเนื้อหาใหม่ของคุณ แต่พวกเขาจะเข้าชมเว็บไซต์ที่เหลือของคุณอีกครั้งพร้อมๆ กัน
หากพวกเขาพบกับความพ่ายแพ้และ/หรือปัญหาหลายอย่างที่สร้างความสับสน พวกเขาจะต้องใช้งบประมาณในการรวบรวมข้อมูลในหน้าเก่า แทนที่จะลงทุนในเนื้อหาใหม่ที่คุณต้องการให้จัดทำดัชนี ซึ่งอาจก่อให้เกิดความล่าช้าและทำให้ URL ของคุณไม่พร้อมใช้งานใน SERP ชั่วคราว (หรือถาวร)
ตัวอย่างเช่น คุณกำลังเผยแพร่ข่าวสารหรือข้อมูลที่สำคัญเพื่อให้มองเห็นได้เร็วที่สุด
คุณคงไม่อยากรอเป็นเวลาหนึ่งสัปดาห์เพื่อให้โพสต์ของคุณได้รับการจัดทำดัชนีใช่ไหม
ท้ายที่สุด คุณไม่สามารถจัดอันดับสำหรับ SERP ได้หากเพจของคุณไม่ได้รับการจัดทำดัชนี สมมติว่าคุณกำลังเขียนเกี่ยวกับเหตุการณ์ระดับโลกที่เกิดขึ้นวันนี้ แต่หน้าเว็บของคุณจะถูกรวบรวมข้อมูลภายในห้าวัน เมื่อถึงจุดนั้น มันสายเกินไปที่จะบรรลุเป้าหมายเริ่มต้นของคุณ เนื่องจากงานไม่เกี่ยวข้องและสดใหม่อีกต่อไป ไม่ต้องพูดถึง เว็บไซต์อื่นๆ มากมายจะเขียนเกี่ยวกับมันและได้รับการจัดทำดัชนีในเวลา
ไม่ใช่เรื่องแปลกที่บ็อตรวบรวมข้อมูลจะใช้เวลาถึงหนึ่งสัปดาห์ในการจัดทำดัชนีหน้าเว็บของคุณ แต่ตามจริงแล้ว ควรใช้เวลาน้อยกว่านั้น
นอกจากนี้ คุณยังจะโพสต์หน้าเว็บใหม่ที่ต้องมีการรวบรวมข้อมูล จัดทำดัชนี และพร้อมใช้งานสำหรับกลุ่มเป้าหมายของคุณในเวลาที่เหมาะสมอีกด้วย และนั่นคือสูตรสำหรับคอขวดของการจัดทำดัชนี
โดยรวมแล้ว หากคุณใช้จ่ายถึงขีดจำกัดของงบประมาณการรวบรวมข้อมูลบ่อยครั้ง คุณอาจเสี่ยงที่หน้าเว็บบางหน้าของคุณลื่นไถลระหว่างรอยแตกร้าวและไม่สามารถไปยัง SERP ได้ ด้วยเหตุนี้ สิ่งเหล่านี้จะไม่ได้รับประโยชน์จากการเข้าชมที่เกิดขึ้นเอง และจะมีการมองเห็นที่ต่ำกว่าเนื้อหาที่เหลือของคุณมาก
และหากคุณสงสัยว่าจะตรวจสอบงบประมาณการรวบรวมข้อมูลของคุณอย่างไร ก็เป็นเรื่องง่าย เพียงไปที่ Google Search Console แล้วตรวจสอบ Crawl → Crawl Stats
รวบรวมข้อมูลการเพิ่มประสิทธิภาพงบประมาณ
สิ่งสำคัญคือต้องจำไว้ว่างบประมาณการรวบรวมข้อมูลขึ้นอยู่กับปัจจัยหลักสามประการ ได้แก่ ขนาดเว็บไซต์ ความสมบูรณ์ของเว็บไซต์ และความนิยมของเว็บไซต์
ซึ่งหมายความว่าคุณ ไม่จำเป็นต้องกังวลเกี่ยวกับการสูญเสียงบประมาณในการรวบรวมข้อมูล หาก:
- เว็บไซต์ของคุณมีขนาดเล็กปานกลาง ซึ่งหมายถึงหน้าเพจน้อยกว่าสองสามพันหน้า
- เว็บไซต์ของคุณไม่มีข้อผิดพลาดเกี่ยวกับรหัสสถานะ และมีการกำหนดรูปแบบบัญญัติที่เหมาะสม
- เว็บไซต์ของคุณเป็นที่นิยม หมายความว่าคุณได้พัฒนาการติดตามโซเชียลมีเดีย และช่องทางอื่นๆ เพื่อแบ่งปันเนื้อหาของคุณและสร้างการเข้าชม
การครอบคลุมเกณฑ์เหล่านี้หมายความว่า Googlebot ควรจะสามารถรวบรวมข้อมูลเว็บไซต์ของคุณได้อย่างมีประสิทธิภาพ
ในกรณีที่คุณขาดปัจจัยสามประการนี้ มีความเสี่ยงที่คุณอาจพบปัญหาการรวบรวมข้อมูลในระดับต่างๆ และสูญเสียการมองเห็นการค้นหาทั่วไปสำหรับหน้าเว็บบางหน้าของคุณ
แนวทางปฏิบัติที่ดีที่สุดสำหรับการรวบรวมข้อมูลงบประมาณที่ควรปฏิบัติตามมีดังนี้
ปรับปรุงความเร็วเว็บไซต์ของคุณ
ดังที่กล่าวไว้ข้างต้น ความเร็วเว็บไซต์และเวลาในการโหลดหน้าเว็บอาจส่งผลต่อขีดจำกัดการรวบรวมข้อมูล เว็บไซต์ที่ดีและรวดเร็วหมายความว่า Googlebot สามารถรวบรวมข้อมูลหน้าเว็บของคุณได้มากขึ้นและใช้เวลาน้อยลง
ในทางกลับกัน หน้าที่โหลดช้ากว่าจะลดอัตราการรวบรวมข้อมูล และในเว็บไซต์ขนาดใหญ่ การทำเช่นนี้อาจส่งผลให้เกิดปัญหาการจัดทำดัชนีโดยรวม
โดยสรุป ตรวจสอบให้แน่ใจว่าได้ปรับความเร็วไซต์ของคุณให้เหมาะสม สิ่งนี้จะไม่เพียงทำให้บอทง่ายขึ้นเท่านั้น แต่ยังช่วยปรับปรุงประสบการณ์ผู้ใช้อีกด้วย
ใช้การเชื่อมโยงภายใน
กรณีที่ดีที่สุดคือการมีลิงก์ย้อนกลับที่ชี้ไปยังทุกหน้าในไซต์ของคุณ นี่ไม่ได้เป็นเพียงแนวทางปฏิบัติ SEO ที่ดีในการดึงดูดผู้เข้าชมมายังไซต์ของคุณและแสดงเครื่องมือค้นหาที่เนื้อหาของคุณมีความสำคัญ แต่ยังดึงดูด Googlebot อีกด้วย
พูดง่ายๆ ก็คือ ลิงก์ย้อนกลับคือหัวใจสำคัญของ SEO
แต่นี่คือข้อตกลง
นอกเหนือจากลิงก์ย้อนกลับแล้ว Google ยังชอบการเชื่อมโยงภายในด้วย ช่วยให้ค้นพบหน้าทั้งหมดของคุณและทำความเข้าใจว่ามีความเกี่ยวข้องกันอย่างไร และในขณะที่ลิงก์ย้อนกลับอาจทำได้ยาก แต่คุณสามารถควบคุมลิงก์ภายในได้อย่างสมบูรณ์และสามารถเพิ่มลิงก์ย้อนกลับได้มากเท่าที่คุณต้องการ (อย่าหักโหมจนเกินไป)
การใช้เทคนิคการเพิ่มประสิทธิภาพนี้จะช่วยให้มั่นใจได้ว่ามีการรวบรวมข้อมูลหน้าเว็บของคุณมากขึ้น
ใช้สถาปัตยกรรมเว็บแบบเรียบ
ความนิยมมีความสำคัญมากในสายตาของ Google ด้วยเหตุนี้จึงเป็นประโยชน์ในการใช้สถาปัตยกรรมเว็บไซต์แบบเรียบ สถาปัตยกรรมแบบเรียบช่วยให้ผู้มีอำนาจลิงก์มีสัดส่วนที่เท่ากันในทุกหน้าของคุณ
จะช่วยให้บอทติดตามว่าลิงก์ในเว็บไซต์ของคุณเชื่อมต่อกันได้ง่ายขึ้นอย่างไร และยังช่วยให้คุณจัดกลุ่มหน้าที่เกี่ยวข้องได้ดีขึ้นและได้รับอำนาจเฉพาะด้าน
ในทางปฏิบัติ หมายความว่าทั้งผู้ใช้และเครื่องมือค้นหาสามารถเข้าถึงหน้าใดก็ได้ในเว็บไซต์ของคุณภายในสี่คลิก
หลีกเลี่ยงหน้าเด็กกำพร้าและเนื้อหาที่ซ้ำกัน
หน้าเด็กกำพร้าคือหน้าที่ไม่มีลิงก์ภายนอกหรือลิงก์ภายใน ซึ่งทำให้หน้าประเภทนี้แยกจากเนื้อหาที่เหลือของคุณ และตามหลักเหตุผลแล้ว Googlebot จะค้นพบหน้าเหล่านี้ได้ยากขึ้น
คุณสามารถหลีกเลี่ยงหน้าเด็กกำพร้าได้ง่ายๆ โดยเพิ่มลิงก์ภายในอย่างน้อยหนึ่งลิงก์ในทุกบทความและทุกหน้าที่คุณมี
จัดการเนื้อหาที่ซ้ำกัน
เนื้อหาที่ซ้ำกันทำให้เกิดปัญหามากมาย การมี URL หลายรายการที่มีพารามิเตอร์คล้ายคลึงกันทำให้เกิดความสับสนสำหรับบอตรวบรวมข้อมูล ซึ่งจะทำให้เสียเวลาของ Googlebot เนื่องจากจะต้องค้นหาว่าหน้าใดเป็นหน้าหลักและหน้าใดเป็นเวอร์ชันที่ซ้ำกัน ซึ่งจะทำให้กระบวนการรวบรวมข้อมูลช้าลง
สำหรับไซต์ต่างๆ เช่น แพลตฟอร์มอีคอมเมิร์ซ ซึ่งเป็นเรื่องปกติที่จะมี URL ที่คล้ายกันหลายรายการ เนื่องจากมีผลิตภัณฑ์ที่คล้ายกันหลายรายการที่มีความแตกต่างเล็กน้อย เช่น ขนาดและสี โปรดใช้แท็กมาตรฐาน ซึ่งจะแนะนำ Googlebot ไปยังหน้าที่คุณต้องการจัดลำดับความสำคัญ
ไม่อนุญาตให้รวบรวมข้อมูลสำหรับบางหน้า
ทุกเว็บไซต์มีหน้าต่างๆ เช่น เข้าสู่ระบบ แบบฟอร์มติดต่อ ตะกร้าสินค้า และอื่นๆ สิ่งเหล่านี้ไม่จำเป็นต้องถูกรวบรวมข้อมูล และยิ่งไปกว่านั้น พวกมันไม่สามารถรวบรวมข้อมูลได้ อย่างไรก็ตาม Google จะพยายาม ดังนั้นควรบอกให้บอทรู้ว่าควรข้ามไปและประหยัดทรัพยากร
ในการดำเนินการนี้ ให้ใช้ไฟล์ robots.txt เพื่อไม่อนุญาตให้รวบรวมข้อมูลของหน้าที่คุณต้องการ
อัปเดตเก่าและเขียนเนื้อหาใหม่
เราพูดถึงว่า Google ชอบเนื้อหาที่สดใหม่หรือไม่? มันทำ
Google อาจหยุดรวบรวมข้อมูลหน้าเว็บของคุณ เนื่องจากไม่มีข้อมูลใหม่เกิดขึ้นในช่วง 2-3 ครั้งล่าสุดที่มีการรวบรวมข้อมูล
ลองนึกภาพ Googlebot เข้าชมไซต์ของคุณทุกๆ สองวัน และทุกครั้งที่พบเนื้อหาใหม่ที่จะจัดทำดัชนี ทันใดนั้น ด้วยเหตุผลบางอย่าง คุณหยุดอัปเดตเว็บไซต์ของคุณ อย่างไรก็ตาม Googlebot ยังคงเข้าชมด้วยความถี่เท่าเดิม หลังจากนั้นไม่นาน บอทจะสังเกตเห็นว่าไม่มีเนื้อหาใหม่ที่จะจัดทำดัชนี และในที่สุดก็ทำให้การเข้าชมน้อยลง
ในสถานการณ์ตรงกันข้าม เมื่อคุณเริ่มนำเสนอเนื้อหาใหม่ๆ บ่อยขึ้น Googlebot สามารถเริ่มเยี่ยมชมเว็บไซต์ของคุณได้บ่อยขึ้น
โดยทั่วไป เมื่อกำหนดว่าหน้าใดจำเป็นต้องอัปเดต ให้สังเกตความเกี่ยวข้อง บทความอาจมีอายุ 2 ปีและยังคงมีข้อมูลที่เกี่ยวข้องอยู่ (แต่คุณควรยังคงอัปเดตอยู่) หรืออาจเป็นวัสดุอายุหนึ่งเดือนที่สูญเสียความสดไปแล้ว
ลดหน้าข้อผิดพลาด
อันนี้ตรงไปตรงมาเพื่อทำความเข้าใจ
Googlebot เสียเวลาในการพยายามรวบรวมข้อมูลหน้าเว็บที่มีรหัสข้อผิดพลาด 5xx (ข้อผิดพลาดของเซิร์ฟเวอร์) รหัสข้อผิดพลาด 4xx (ข้อผิดพลาดที่ไม่พบ) รหัสข้อผิดพลาด 3xx (การเปลี่ยนเส้นทาง) เป็นต้น และด้วยเหตุนี้ จึงทำให้ขีดจำกัดอัตราการรวบรวมข้อมูลของคุณลดลง
โดยพื้นฐานแล้ว ทุกหน้าที่ส่งผลให้โค้ดแตกต่างจาก 200 จะเสียเวลาและรวบรวมข้อมูลทรัพยากร ในทางปฏิบัติ ไม่จำเป็นต้องดึงความสนใจของ Google ไปยังหน้าที่คุณลบหรือเปลี่ยนเส้นทาง ให้จัดลำดับความสำคัญในการแก้ไข URL ที่ใช้งานจริงของคุณแทน
รวบรวมข้อมูลการเพิ่มประสิทธิภาพงบประมาณโดยสังเขป
มาสรุปขั้นตอนในการเพิ่มประสิทธิภาพงบประมาณการรวบรวมข้อมูลของ Google กัน:
- เร่งความเร็วเว็บไซต์ของคุณ
- วางลิงค์ภายในในทุกหน้า
- ใช้สถาปัตยกรรมเว็บไซต์แบบเรียบ
- หลีกเลี่ยงหน้าเด็กกำพร้าและเนื้อหาที่ซ้ำกัน
- ป้องกันการรวบรวมข้อมูลในบางหน้า
- อัพเดทเก่าเขียนใหม่
- ลดหน้าข้อผิดพลาด
เคล็ดลับโบนัส
คุณสามารถตรวจสอบความถี่ในการรวบรวมข้อมูลเว็บไซต์ของคุณได้โดยทำการวิเคราะห์ไฟล์บันทึก ด้วยวิธีนี้ คุณจะระบุได้ว่ามีการรวบรวมข้อมูลหน้าเว็บบางหน้าบ่อยกว่าหน้าอื่นๆ หรือไม่
นอกจากนี้ การวิเคราะห์ไฟล์บันทึกสามารถช่วยให้คุณเข้าใจว่ามีปัญหาในพื้นที่เฉพาะของเว็บไซต์หรือไม่
นอกจากนี้ การวิเคราะห์ไฟล์บันทึกสามารถช่วยให้คุณเข้าใจว่ามีปัญหาในพื้นที่เฉพาะของเว็บไซต์หรือไม่
บรรทัดล่าง
งบประมาณการรวบรวมข้อมูลมีความสำคัญต่อการมองเห็นเครื่องมือค้นหาโดยรวมของเว็บไซต์ของคุณ หาก Googlebot ไม่สามารถรวบรวมข้อมูลและจัดทำดัชนีหน้าเว็บของคุณได้ แสดงว่าคุณไม่มีตัวตนในโลกออนไลน์
ตรวจสอบให้แน่ใจว่าได้ใช้เทคนิคการเพิ่มประสิทธิภาพงบประมาณการตระเวนทั้งหมดที่เรากล่าวถึงในบทความ และคุณจะได้รับผลตอบแทน
Google จะสามารถค้นหาและจัดทำดัชนีเนื้อหาของคุณได้เร็วขึ้น และท้ายที่สุด เว็บไซต์ของคุณจะเป็นผู้นำการแข่งขันที่ล้มเหลวหรือละเลยการเพิ่มประสิทธิภาพ
1:0 สำหรับคุณ! ทำได้ดีมาก!