แผนผังเว็บไซต์ XML และ SEO: สิ่งที่คุณต้องรู้
เผยแพร่แล้ว: 2023-08-16แผนผังไซต์ XML เพิ่งครบรอบ 18 ปีในเดือนมิถุนายน และเพื่อเป็นเกียรติแก่การเริ่มต้นเข้าสู่วัยผู้ใหญ่อย่างเต็มรูปแบบ ฉันจะแจกแจงวิธีการทำงานของแผนผังไซต์ XML วิธีสร้าง และเหตุใดแผนผังไซต์ XML จึงให้ประโยชน์ด้าน SEO มากมาย
แผนผังไซต์ XML คืออะไร
โดยสรุป แผนผังไซต์ XML เป็นโปรโตคอลในรูปแบบ XML ที่บอกเครื่องมือค้นหาเกี่ยวกับ URL บนเว็บไซต์ที่สามารถรวบรวมข้อมูลได้
แผนผังไซต์ XML มีวัตถุประสงค์เพื่อแบ่งปันข้อมูลเกี่ยวกับแต่ละ URL เช่น:
- เมื่อมีการปรับปรุงครั้งล่าสุด
- มันเปลี่ยนแปลงบ่อยแค่ไหน
- มีความสำคัญเพียงใดเมื่อเทียบกับ URL อื่นๆ ในเว็บไซต์ของคุณ
แผนผังเว็บไซต์ XML ช่วยให้เครื่องมือค้นหารวบรวมข้อมูลเว็บไซต์ของคุณได้อย่างมีประสิทธิภาพมากขึ้นหากแยก URL บางรายการออก
หากคุณเป็นมืออาชีพด้าน SEO คุณอาจใช้แผนผังไซต์ XML ที่สร้างไว้ในปลั๊กอิน Yoast WordPress ของคุณอยู่แล้ว แต่มีสิ่งพิเศษมากมายที่คุณอาจขาดหายไป
วิธีสร้างแผนผังไซต์ XML แบบไดนามิก
หากคุณใช้ WordPress ให้ใช้ประโยชน์จากปลั๊กอิน SEO เช่น Yoast และ RankMath เพื่อสร้างแผนผังไซต์ XML แบบไดนามิก
หากคุณไม่ได้ใช้ WordPress ให้ทำตามขั้นตอนเหล่านี้เพื่อสร้างแผนผังไซต์ XML แบบไดนามิก
ทำความเข้าใจโครงสร้างการนำทางของคุณ
รวบรวมรายการ URL ทั้งหมดของเราบนเว็บไซต์และจัดกลุ่มให้สอดคล้องกับโครงสร้างการนำทางและการจัดกลุ่มเนื้อหา
เป็นพันธมิตรกับทีมนักพัฒนาของคุณ
แชร์รายการ URL ที่จัดกลุ่มร่วมกับทีมนักพัฒนาของคุณเพื่อรับความช่วยเหลือในการสร้างแผนผังไซต์ XML แบบไดนามิกโดยใช้ Python, PHP หรือ JavaScript
นี่คือตัวอย่างการเขียนโค้ดแผนผังไซต์ XML แบบไดนามิกโดยใช้ Python:
import xml.etree.ElementTree as ET import datetime # List of URLs (replace these with your actual URLs) urls = [ "https://www.example.com/page1", "https://www.example.com/page2", "https://www.example.com/page3", # Add more URLs here ] # Create the root element urlset = ET.Element("urlset") urlset.set("xmlns", "http://www.sitemaps.org/schemas/sitemap/0.9") # Loop through URLs and create URL entries for url in urls: url_elem = ET.SubElement(urlset, "url") loc_elem = ET.SubElement(url_elem, "loc") loc_elem.text = url lastmod_elem = ET.SubElement(url_elem, "lastmod") lastmod_elem.text = datetime.datetime.now().isoformat() changefreq_elem = ET.SubElement(url_elem, "changefreq") changefreq_elem.text = "daily" # You can set this to the desired frequency priority_elem = ET.SubElement(url_elem, "priority") priority_elem.text = "0.5" # You can set this to a value between 0 and 1 # Create the XML tree tree = ET.ElementTree(urlset) # Save the XML to a file tree.write("sitemap.xml", encoding="utf-8", xml_declaration=True)
เมื่อทำงานกับนักพัฒนา ฉันได้ใช้ประโยชน์จาก Flask และ Python ร่วมกันเพื่อสร้างแผนผังไซต์ XML แบบไดนามิกอย่างแท้จริง ซึ่งจะเปลี่ยนแปลงเมื่อใดก็ตามที่เนื้อหาของเว็บไซต์เปลี่ยนแปลง
หากเราสามารถกำหนดเส้นทางแผนผังไซต์แบบไดนามิกตามเนื้อหาของเว็บไซต์โดยใช้ฟังก์ชัน เช่น get_dynamic_urls()
เราน่าจะสามารถดึง URL ทั้งหมดได้
@app.route('/sitemap.xml', methods=['GET']) def sitemap(): urls = get_dynamic_urls() # Replace with your dynamic URL retrieval logic urlset = ET.Element("urlset") urlset.set("xmlns", "http://www.sitemaps.org/schemas/sitemap/0.9") for url in urls: url_elem = ET.SubElement(urlset, "url") loc_elem = ET.SubElement(url_elem, "loc") loc_elem.text = url lastmod_elem = ET.SubElement(url_elem, "lastmod") lastmod_elem.text = datetime.datetime.now().isoformat() changefreq_elem = ET.SubElement(url_elem, "changefreq") changefreq_elem.text = "daily" priority_elem = ET.SubElement(url_elem, "priority") priority_elem.text = "0.5" xml_content = ET.tostring(urlset, encoding="utf-8") return xml_content, {'Content-Type': 'application/xml'}
หากคุณใช้โค้ดร่วมกันในหลายๆ คุณสมบัติของโดเมน ตรวจสอบให้แน่ใจว่าไฟล์มีการเข้ารหัสอย่างถูกต้องบนหน้า HTML ของคุณ
ตัวอย่างเช่น ไฟล์ CSS และ JavaScript ของคุณควรเชื่อมโยงโดยใช้แท็ก <link>
และ <script>
ก่อนที่จะแบ่งปันรหัสข้ามโดเมนต่างๆ คุณจะต้องสร้างเซิร์ฟเวอร์ส่วนกลางเพื่อโฮสต์กฎแผนผังไซต์ XML ที่ใช้ร่วมกัน
คุณจะมีหลายขั้นตอนของแผนผังไซต์ XML แบบไดนามิกกับนักพัฒนาของคุณจนกว่ากฎทั้งหมดจะได้รับการยืนยัน
อย่าลืมตรวจสอบว่ามีการดึง URL แบบไดนามิกและรวมเข้ากับตรรกะแผนผังไซต์ของคุณจริงๆ
อัปโหลดไปยังเซิร์ฟเวอร์ของคุณ
เมื่อแผนผังไซต์ XML ของคุณถูกบีบอัดแล้ว ให้อัปโหลดแผนผังไซต์ XML แบบไดนามิกไปยังไดเรกทอรีรากของเว็บไซต์ของคุณ
ส่งไปยังเครื่องมือค้นหา
แจ้งให้เครื่องมือค้นหาทราบเกี่ยวกับแผนผังไซต์ XML ของคุณโดยส่งผ่าน Google Search Console และ Bing Webmaster Tools
การบำรุงรักษาอย่างต่อเนื่อง
แผนผังไซต์ XML ไม่ใช่แค่ชั้นเชิง SEO แบบ “ตั้งค่าแล้วลืม” การอัปเดตแผนผังไซต์ XML ของคุณเป็นสิ่งสำคัญเมื่อเว็บไซต์ของคุณเปลี่ยนแปลง
15 เคล็ดลับที่ควรทราบเมื่อสร้างแผนผังไซต์ XML
1. แผนผังไซต์ XML ไม่ใช่ปัจจัยในการจัดอันดับ
เมื่อถาม X (ก่อนหน้านี้คือ Twitter) ว่ามีประโยชน์ในการจัดอันดับในการใช้แผนผังไซต์ XML หรือไม่ Gary Illyes จาก Google ตอบว่า:
- “ไม่ ไม่ชี้นำอยู่แล้ว”
2. Google สามารถค้นหาหน้าเว็บของคุณโดยไม่ต้องใช้แผนผังเว็บไซต์
เว็บไซต์ไม่จำเป็นต้องมีแผนผังไซต์หากมีขนาดเล็กและเชื่อมโยงอย่างถูกต้อง Daniel Waisberg ผู้สนับสนุนการค้นหาของ Google แชร์ในวิดีโอฝึกอบรม Google Search Console
อย่างไรก็ตาม เขากล่าวต่อว่าแผนผังไซต์อาจมีประโยชน์อย่างยิ่งหาก:
- ไซต์มีขนาดใหญ่มาก
- หน้าของไซต์ถูกแยกออกจากกัน
- เว็บไซต์ใหม่หรือมีการเปลี่ยนแปลงอย่างรวดเร็ว
นอกจากนี้ สิ่งสำคัญคือต้องทราบว่า John Muller จาก Google ระบุใน X (ก่อนหน้านี้คือ Twitter) ว่าการมีแผนผังไซต์ XML เป็น "พื้นฐานขั้นต่ำสำหรับเว็บไซต์ที่จริงจังใดๆ"
3. Google ตรวจสอบเพื่อดูว่าแผนผังไซต์ XML ของคุณมีการเปลี่ยนแปลงหรือไม่ก่อนที่จะประมวลผลใหม่
Google จะตรวจสอบว่าแผนผังไซต์ XML ของคุณมีการเปลี่ยนแปลงหรือไม่ก่อนที่จะเสียทรัพยากรในการแยกวิเคราะห์และประมวลผลไฟล์อีกครั้ง Illyes ยืนยัน
เขาระบุไว้ใน SEO Office Hours
- “ทันทีที่คุณเปลี่ยนแปลงบางอย่างในแผนผังไซต์ ไม่ว่าจะเป็นองค์ประกอบ URL หรือม็อดสุดท้าย แผนผังไซต์จะถูกแยกวิเคราะห์อีกครั้งและโดยทั่วไปจะประมวลผลใหม่ ไม่ได้หมายความว่า URL นั้นจะได้รับการรวบรวมข้อมูลอย่างแน่นอน แน่นอนว่า URL เหล่านั้นยังคงต้องผ่านการประเมินคุณภาพเช่นเดียวกับ URL อื่นๆ นอกจากนี้ยังควรพูดถึงว่าหากคุณลบ URL ออกจากแผนผังไซต์เพราะบางทีอาจไม่มีอยู่อีกต่อไป นั่นไม่ได้หมายความว่า URL นั้นจะถูกลบออกจากดัชนีโดยอัตโนมัติ หรือแม้แต่จัดลำดับความสำคัญสำหรับการรวบรวมข้อมูลเพื่อให้สามารถลบได้เร็วขึ้น”
4. แผนผังไซต์ XML สามารถจัดทำดัชนีเนื้อหาใหม่ของคุณได้เร็วขึ้น
Mueller ยืนยันว่าการแจ้งให้ Google ทราบว่าแผนผังไซต์ XML ของคุณได้รับการอัปเดตแล้วสามารถช่วยให้เนื้อหาใหม่ของคุณจัดทำดัชนีได้เร็วขึ้น
เขาแบ่งปัน:
- “การ Ping แผนผังไซต์แตกต่างจากการระบุใน robots.txt เล็กน้อย — การ Ping หมายความว่าคุณกำลังตั้งค่าสถานะการเปลี่ยนแปลงในไฟล์แผนผังไซต์ หากคุณต้องการจัดทำดัชนีเนื้อหาใหม่อย่างรวดเร็ว นั่นเป็นแนวทางปฏิบัติที่ดี”
5. แผนผังไซต์ XML จะต้องเข้ารหัส UTF-8
หากแผนผังไซต์ XML ของคุณไม่ได้ใช้ UTF-8 เครื่องมือค้นหาจะไม่สามารถอ่านได้
6. รักษาขนาดไฟล์ให้ต่ำกว่า 50 MB (ไม่บีบอัด) หรือ 50,000 URL
แผนผังไซต์ XML ของคุณมีขนาดจำกัด เก็บไว้ไม่เกิน 50,000 URL ต่อแผนผังไซต์หรือ 50 MB (ไม่บีบอัด)
หากคุณมีขนาดไฟล์ที่ใหญ่กว่าหรือมี URL มากกว่า ให้ใช้แผนผังไซต์ XML หลายรายการ
7. คุณสามารถมีแผนผังไซต์ XML ได้หลายรายการ
Google ให้คุณส่งแผนผังเว็บไซต์ได้หลายรายการ การแยกแผนผังไซต์ออกเป็นส่วนต่างๆ ของเว็บไซต์เพื่อวัดประสิทธิภาพอาจมีประโยชน์
ตัวอย่างเช่น หากคุณเป็นเว็บไซต์อีคอมเมิร์ซขนาดใหญ่ คุณสามารถแบ่งกลุ่มแผนผังไซต์ XML ของคุณตามประเภทผลิตภัณฑ์ (เช่น รองเท้าผู้หญิงเทียบกับรองเท้าผู้ชาย)
หรือหากคุณมีหลายภาษา คุณอาจต้องการ hreflang ที่เกี่ยวข้องกับแผนผังไซต์ XML <loc> ของคุณ
หากคุณมีภาษาอื่น ภาษาจะไม่นับรวมกับ URL สูงสุด 50,000 รายการ
หรือถ้าคุณมีวิดีโอหรือรูปภาพจำนวนมาก คุณสามารถแยกแผนผังไซต์ XML ออกเป็นแผนผังไซต์ XML ของวิดีโอและแผนผังไซต์ XML แบบรูปภาพ
การมีแผนผังไซต์ XML หลายรายการไม่มีประโยชน์ต่ออันดับ
8. หากคุณมีแผนผังไซต์ XML หลายรายการ อย่าลืมใช้ไฟล์ดัชนีแผนผังไซต์
หากคุณมีแผนผังไซต์ XML หลายรายการสำหรับไซต์ขนาดใหญ่ คุณจะต้องส่งไฟล์ดัชนีแผนผังไซต์เพื่อส่งแผนผังไซต์จำนวนมากพร้อมกัน
9. แท็ก lastmod ควรไม่มีที่ติ
แท็ก <lastmod>
เป็นหนึ่งในส่วนที่สำคัญที่สุดของแผนผังไซต์ XML ของคุณ
ตัวอย่างเช่น ข้อมูลที่มีโครงสร้างใช้ประโยชน์จากวันที่ <lastmod> ของแผนผังไซต์ XML ของฉัน
แท็ก <lastmod>
ยังส่งสัญญาณไปยังเครื่องมือค้นหาว่าคุณได้รีเฟรชเนื้อหาเก่าหรือเปิดตัวเนื้อหาใหม่แล้ว
มูลเลอร์ยืนยันสิ่งนี้โดยระบุว่า:
- “…ถ้าคุณแค่เปลี่ยนส่วนท้ายของการประทับเวลา แน่นอนว่าหน้านั้นมีการเปลี่ยนแปลงทางเทคนิคด้วย แต่ควรจัดลำดับความสำคัญนั้น – อาจจะไม่”
Bing ยังแสดงจุดยืนอย่างเป็นทางการเกี่ยวกับแท็ก lastmod
ในแผนผังไซต์ XML โดยระบุว่า:
- “สำหรับแผนผังไซต์ XML หนึ่งในแท็กที่สำคัญที่สุดที่คุณสามารถรวมไว้ในแผนผังไซต์ของคุณได้คือแท็ก “lastmod””
10. แผนผังไซต์ XML ควรมี URL สถานะเพียง 200 รายการเท่านั้น
อย่าลืมเก็บเฉพาะ URL ที่ใช้งานอยู่, สถานะ 200 รายการ, จัดทำดัชนีได้และตั้งค่าเป็นบัญญัติเอง
หากคุณยังคงแสดงหน้าที่เปลี่ยนเส้นทาง 404 หรือ 301 ต่อไป เครื่องมือค้นหาอาจหยุดการรวบรวมข้อมูลแผนผังไซต์ XML ของคุณโดยสิ้นเชิง
Mueller ตอบกลับความคิดเห็นเกี่ยวกับ X (เดิมชื่อ Twitter):
- “เราจะหยุดเรียกไฟล์แผนผังไซต์หาก URL ไม่ถูกต้อง แต่ถ้าคุณส่งคืนเนื้อหาหรือเปลี่ยนเส้นทาง (ซึ่งค่อนข้างจะแนะนำ) เราจะลองใช้ต่อไป ซึ่งไม่ควรทำให้เกิดปัญหา เนื่องจากไฟล์แผนผังเว็บไซต์โดยรวมเป็นเพียงส่วนเล็กๆ ของ URL ทั้งหมดที่ดึงมาจากเว็บไซต์”
11. เครื่องมือค้นหาสามารถตรวจสอบแผนผังไซต์ XML ของคุณได้ทุกวัน
Fabrice Canel จาก Microsoft แชร์ว่า Microsoft ตรวจสอบแผนผังไซต์ XML ของคุณทุกวัน
ในขณะที่มูลเลอร์บอกว่า Google ตรวจสอบแผนผังไซต์ XML ของคุณตามความถี่ (หรือที่เรียกว่าแท็ก <lastmod>
ของคุณ)
12. ความเร็วของเพจส่งผลทางอ้อมต่อแผนผังไซต์ XML ของคุณ
เราทุกคนทราบดีว่าความเร็วของหน้าเว็บมีความสำคัญต่อการทำ SEO ของเราเพียงใด แต่เว็บไซต์ที่ทำงานช้าจะส่งผลกระทบต่อแผนผังไซต์ XML ของคุณอย่างไร
Mueller ยืนยันว่าความเร็วของหน้าเว็บไม่ควรส่งผลกระทบต่อแผนผังไซต์ XML ของคุณโดยระบุ:
- “ตราบใดที่ยังไม่หมดเวลา คุณก็น่าจะสบายดี อาจแคชเวอร์ชันล่าสุดเพื่อป้องกันการโหลดเซิร์ฟเวอร์โดยไม่จำเป็น”
ความจริงก็คือ ฉันเคยทำงานกับเว็บไซต์ที่ทำงานช้า โดยที่แผนผังไซต์ XML ไม่โหลดเมื่อเครื่องมือค้นหารวบรวมข้อมูลเว็บไซต์ ซึ่งทำให้เกิดความผันผวนของอันดับอย่างมาก
มีผลกระทบทางอ้อมต่อแผนผังไซต์ XML ของคุณหากเว็บไซต์ของคุณไม่โหลดอย่างถูกต้อง
ด้วยเหตุนี้จึงเป็นเรื่องสำคัญที่ต้องใช้การบีบอัด Gzip เพื่อลดขนาดไฟล์และเพิ่มความเร็วในการโหลด
13. ลบแท็ก <priority> ออกจากแผนผังไซต์ XML ของคุณ
Illyes เปรียบเทียบแท็ก <priority>
ในแผนผังไซต์ XML กับ "เสียงรบกวน"
ดังนั้น หากคุณต้องพึ่งพาเครื่องมือค้นหาในการรวบรวมข้อมูล URL ของคุณในแผนผังไซต์ XML ตามลำดับความสำคัญ คุณจะต้องรอนาน
ฉันแนะนำให้ลบแท็กนี้ออกจากแผนผังไซต์ XML ของคุณ
14. หากคุณมีปัญหาเกี่ยวกับโครงสร้างการนำทาง ให้จับคู่แผนผังไซต์ XML ของคุณกับแผนผังไซต์ HTML
มีความรู้สึกที่หลากหลายเกี่ยวกับแผนผังไซต์ HTML
Mueller แบ่งปันว่าแผนผังเว็บไซต์ HTML “ไม่ควรมีความจำเป็น”
เขาพูดต่อ:
- “ฉันเปลี่ยนใจใช้แผนผังไซต์ HTML ในช่วงหลายปีที่ผ่านมา ซึ่งไม่จำเป็นเลย ไซต์ขนาดเล็กและขนาดใหญ่ควรมีโครงสร้างการนำทางที่ชัดเจนเสมอ หากคุณรู้สึกว่าจำเป็นต้องมีแผนผังไซต์ HTML ให้ใช้เวลาปรับปรุงสถาปัตยกรรมของไซต์แทน แผนผังเว็บไซต์ HTML อยู่ในถังเดียวกันกับสปินเนอร์โหลด HTML”
<iframe src="https://mastodon.social/@johnmu/109477617298107922/embed" class="mastodon-embed" width="400" allowfullscreen="allowfullscreen"></iframe><script src="https://mastodon.social/embed.js" async="async"></script>
เมื่อทำงานบนเว็บไซต์ขนาดใหญ่ในระดับองค์กร มักจะมีผู้มีอำนาจตัดสินใจหลายชั้นในโครงสร้างการนำทางเว็บไซต์ และบ่อยครั้ง แนวทางปฏิบัติที่ดีที่สุดสำหรับ SEO จะถูกนำมาพิจารณาด้วย
ฉันจับคู่ทั้งแผนผังไซต์ XML ของฉันกับแผนผังไซต์ HTML จนกว่าฉันจะมั่นใจในการนำทางเว็บไซต์และลำดับชั้นของการเชื่อมโยงภายใน
15. อย่าลืมรวมแผนผังไซต์ XML ของคุณทั้งหมดไว้ในไฟล์ robots.txt
อย่าลืมรวมแผนผังไซต์ XML ของคุณ (ทั้งหมด) เป็นลิงก์ในไฟล์ robots.txt
นี่คือตัวอย่าง:
ไม่ต้องกังวลว่าควรไปที่ใดในไฟล์ robots.txt ไม่มีผลกระทบต่อตำแหน่งของแผนผังเว็บไซต์ XML ในไฟล์ robots.txt
มูลเลอร์ยืนยันสิ่งนี้:
แผนผังไซต์ XML เป็นพิมพ์เขียวของเว็บไซต์ของคุณสำหรับเครื่องมือค้นหา
ไม่ว่าคุณจะเปิดตัวหน้าเว็บใหม่หรือเพียงแค่เพิ่มแท็ก Canonical ลงในหน้าที่ซ้ำกัน แผนผังไซต์ XML ของคุณคือสิ่งที่คุณควรอัปเดตทุกวันตลอด 24 ชั่วโมง
แต่ทำด้วยความระมัดระวัง
แม้ว่าคุณจะไม่ควรหวาดระแวง แต่แผนผังไซต์ XML ของคุณก็เป็นแบบพิมพ์เขียวของเครื่องมือค้นหา
ดังนั้นอย่าลืมส่งแผนผังไซต์ XML ของคุณไปยัง Google Search Console และ Bing Webmaster Tools
ความคิดเห็นที่แสดงในบทความนี้เป็นความคิดเห็นของผู้เขียนรับเชิญและไม่จำเป็นต้องเป็น Search Engine Land ผู้เขียนเจ้าหน้าที่อยู่ที่นี่