在 XML 站点地图中发现的四个常见问题以及如何解决它们

已发表: 2022-10-26


XML 站点地图中存在哪些常见问题? 它们有什么影响,你如何解决它们?

这就是我们今天要与一位女士讨论的内容,当她不从事项目工作或撰写有关 SEO 的文章时,她会花时间种植西红柿、辣椒和香草。 她最近接受了 Aleyda Solis 和发展中国家技术 SEO 自由职业者联盟的指导。 作为自由承包商和 Tech SEO Journal 的创始人。 热烈欢迎 In Search SEO 播客 Katherine Nwanorue。

在这一集中,Katherine 分享了四个常见的 XML 站点地图问题以及如何解决这些问题,包括:
  • 列出不合格的 URL
  • 不支持的 HTML 格式错误
  • 未正确声明页面及其替代版本
  • 为网站的不同部分提供一个更大的站点地图

凯瑟琳:嗨,大卫。 感谢您的款待。

D:嘿,凯瑟琳。 很高兴有你在这里。 你可以在 techseojournal.com 上找到 Katherine。 那么凯瑟琳,为什么 XML 站点地图如此重要?

克:这是个好问题。 对我来说,拥有 XML 站点地图有两个主要好处。 一方面,它可以帮助搜索引擎找到您的重要页面。 如果您正在处理一个较小的网站,该网站有 500 个或更少的页面、良好的内部链接结构以及不经常更改的页面,那么在这种情况下,拥有 XML 站点地图并不是您的首要任务。 但是,如果您正在处理较大的网站,您的内容经常更改,内部链接结构不佳和孤立页面,那么拥有站点地图是有意义的,因为它可以帮助搜索引擎找到您的重要页面。

但我还想提一下,拥有 XML 站点地图并不能保证索引。 它更像是对搜索引擎的提示、线索。 这就像对 Google 说:“嘿,我有这些非常酷的页面,我认为应该编入索引。你介意看一下吗?”

拥有 XML 站点地图的第二个好处是它有助于解决 SEO 问题,尤其是索引问题。 但我会回到这个。

D:太好了,现在你说的是更大的网站。 您是否有一定数量的页面,如果一个站点有超过一定数量的页面,那么使用 XML 站点地图是个好主意?

K:Google 文档推荐 500 页或更多,这与较小的网站相反。 但在大多数情况下,1000 页或更多就可以了。

D:能有明确的数字来关注那里真是太好了。 所以今天,您将分享 XML 站点地图的四个常见问题。 从第一开始,列出不合格的 URL。



1. 列出不合格的 URL



K:是的,不合格的 URL 是指生成 404 错误代码的 URL。 也许他们被 robots.txt 阻止了,或者他们有一个 noindex 标签,或者他们正在被重定向。 这通常出现在您可能手动创建站点地图并且这些错误页面以某种方式将其放入文件的情况下。 出现这种情况的另一个原因是,也许您创建了一个不会自动更新的 XML 站点地图,它是静态的。 因此,当您在网站上创建新页面时,它不会反映在站点地图上。 这是一个问题,因为搜索引擎不是在抓取您的有效页面,而是在浪费时间尝试访问您重度重定向的内容或他们不应该访问的页面。 谷歌已经提到,如果他们在多次尝试后未能抓取站点地图,他们最终将停止尝试。 这首先违背了拥有 XML 站点地图的目的。

D:因此,如果您在 XML 站点地图中保留不合格的 URL,那么最终 Google 将忽略您的 XML 站点地图,或者甚至不相信您的整个网站具有权威性。 当 XML 站点地图生成不受支持的 HTML 格式错误时,这将我们排在第二位。



2.不支持的HTML格式错误



K:首先,我想描述一下 HTML 站点地图的全部内容。 HTML 站点地图是其内容、指向您的页面的链接以及您网站上的部分。 它通常是供人类用户浏览您的网站的。 它位于您网站的页脚部分。 是的,在大多数情况下,搜索引擎也可以通过这些链接找到您的网页。 但这就是 XML 站点地图的相似之处。 HTML 站点地图没有修改日期。 如果您有视频,您甚至可能无法将这些视频链接到 HTML 站点地图。

如果您真的想告诉搜索引擎您现有和更新的内容,那么您应该坚持使用 XML 站点地图。 但是,如果您尝试提交 XML 站点地图并且收到此 HTML 格式的错误,那么您可能实际上是在提交 HTML 格式的文件,或者您的站点地图有错误使其难以阅读。

出现这种情况的另一个常见原因是您的网站上有一个缓存功能,其中插件、服务器或配置正在阻碍,而是以 HTML 格式提供文件。

D:那里也有很好的提示。 同时拥有一个 HTML 站点地图和一个 XML 站点地图有什么好处,或者一个 XML 站点地图本身就足够了吗?

K:两者都有好处。 如果你能在某件事上获得额外的价值,为什么不呢? 如果您的页面具有非常长的爬网深度,有些页面很难到达,那么 HTML 站点地图可以帮助您将用户带到他们应该进入的页面并帮助他们浏览您的网站。 另一方面,XML 站点地图适用于搜索引擎。 因此,在这种情况下,您正在考虑用户和爬虫。 所以,是的,两者兼而有之绝对是个好主意。

D:您显然谈到了正确编码 XML 站点地图的重要性。 您是否建议检查您的 XML 站点地图是否编码正确?

K:是的,如果您担心您的 XML 站点地图可能是 HTML 文件,您应该尝试在 Google Search Console 上提交它。 您可能会得到一个响应,即这是一个 HTML 站点地图。 当这种情况发生时,要找出真正造成这种情况的原因,请在浏览器上打开 XML 站点地图,并使用 Chrome 开发工具检查页面。 如果有一个插件,或者它是服务器缓存,您可能会看到一个阻碍事物的列表。 一旦发现有缓存功能,您就可以继续更改配置,清除缓存,一切都应该恢复原状。 但是,如果您没有看到任何缓存功能妨碍您,那么您可能会遇到错误。 在这种情况下,您需要使用 XML 站点地图验证器来检查站点地图上是否存在错误或错误编码的属性。

D:辉煌。 如果您的 XML 站点地图编码正确,如果它是正确的 XML,那么缓存插件是否会冻结您的 XML 站点地图以使其无法正确更新? 或者这不是 XML 文件的危险吗?

克:那是一种危险。 这就是为什么我建议您确保插件中没有缓存。 许多插件中有一个设置,您可以在其中缓存站点地图,但您不应该这样做,因为它可能会导致我提到的问题。 它可以使 XML 站点地图以 HTML 文件的形式出现。 它可能会产生很多错误,因此最好不要缓存您的 XML 站点地图。 请不要。 最好不要。

D:第三个是没有正确声明页面及其替代版本。



3. 未正确声明页面及其替代版本



K:这适用于您在 XML 站点地图上实现 hreflang 标记的情况。 在这种情况下,您需要指定要编入索引的 URL 及其替代版本,包括其自身。 例如,假设我的网站上有一个面向英语使用者的页面,我希望它被编入索引。 但同时,我有两个替代版本。 我有针对瑞士用户的德语版和针对中国用户的中文版。 所以要做到这一点,我会指定英文页面的 URL,然后列出这三个版本。 瑞士有德文版,中国有中文版,还有英文版。

而且这些标签是互惠的。 因此,如果每个引用的替代版本不指向另一个,就会出现问题。 您的 XML 站点地图可能会出现您的 hreflang 标记被错误解释或被完全忽略的问题。

D:这将我们带到第四位,即为网站的不同部分提供一个更大的站点地图。



4. 为网站的不同部分提供一个更大的站点地图



克:对。 目前,Google 支持在单个站点地图中包含 50,000 个 URL,或未压缩最大 50 MB 的站点地图大小,以您首先点击的为准。 这并不意味着如果您有 50,000 个 URL,您应该在一页上列出所有这些 URL。 这不是好的做法,因为它可能使您难以解决问题。 您将不知道您网站的哪些部分存在索引或爬网问题,搜索引擎和爬虫没有进入的部分。

理想情况下,您应该按部分对站点地图进行分段。 例如,如果您有一个电子商务网站,您可以为静态页面(关于我们、条款和条件等)创建一个站点地图,然后为您的类别页面创建不同的站点地图。 通过这种方式,您可以轻松地发现问题并在 Google Search Console 上的行业报告中进行过滤,即您网站中没有按应有的方式被抓取和编入索引的部分。

D:您的站点可以拥有的站点地图数量是否有上限?

K:目前,我现在真的不能给它一个数字。

D:定期检查和诊断您的 XML 站点地图怎么样? 您是否应该每月检查一次是否有错误?

K:我不建议每月一次。 如果你真的想知道你的网站上发生了什么,你应该,你应该检查你的谷歌搜索控制台,因为在那里你可以看到站点地图的这些错误。 您应该定期检查它,如果可以的话,每天或每周检查一次,具体取决于您发布的页面数。 如果您每天都发布内容,那么进行大量检查是有意义的。 但是,如果您的页面很少更改,那么每周就可以了。 但是,请您检查一下。

D:阅读、收听或观看此内容的人认为我需要更多地了解 XML 站点地图。 是否有任何资源可以推荐给人们以了解有关 XML 站点地图的更多信息?

克:是的。 您应该查看 Google 文档。 他们有大量关于 XML 站点地图的全部内容、如何创建站点地图、最佳实践以及如何管理多语言站点的文档。 几乎你能找到的每一条信息都在那里。





Pareto Pickle - 具有良好的内部链接结构



D:好极了。 让我们以 Pareto Pickle 结束。 帕累托说,你可以从 20% 的努力中获得 80% 的结果。 您会推荐哪一项 SEO 活动,以适度的努力提供令人难以置信的结果?

K:我会说良好的内部链接结构。 这是因为它是搜索引擎 URL 发现的主要来源。 他们可以通过您网站中的链接访问您网站上的重要页面。 除此之外,您还可以使用链接将 SEO 价值传递给其他页面。 或者你也可以用它来表示一个页面相对于其他页面的相对重要性以及你的页面之间的关系。 所以是的,一个好的内部链接结构是最好的。

D:那么拥有良好的内部链接结构是否意味着不需要 XML 站点地图?

克: 不是真的。 正如我所提到的,如果您有一个良好的内部链接结构和一个较小的网站,那么拥有 XML 站点地图并不是优先事项。 但是有些站点可以从 XML 站点地图中看到比其他站点更多的价值。 如果您的页面非常大,您可以拥有良好的内部链接结构,但谁不想要更多的价值? 谁不想让搜索引擎准时到达他们的页面? 因此,XML 站点地图就像您采取的次要预防措施,而良好的内部链接结构是您采取的主要步骤。

D:如果您有良好的内部链接,是否需要 HTML 站点地图?

K:如果用户在导航到您的网站时仍然遇到问题,那么 HTML 站点地图是有意义的。

D:明白。 因此,如果您在获取 URL 排名或导航方面遇到问题,如您所说,那么 HTML 站点地图可能对用户和搜索引擎都有好处。 但是,如果您要编入索引的所有页面都已编入索引,则没有必要拥有 HTML 站点地图。

K:是的,没有必要。 在这种情况下很高兴,但不是必须的。

D:嗯,我一直是你的主人,大卫·贝恩。 你可以在 techseojournal.com 上找到 Katherine。 凯瑟琳,非常感谢您参加 In Search SEO 播客。

K:谢谢你邀请我。 这是我的荣幸。

D:谢谢你的聆听。 查看之前的所有剧集,并在 rankranger.com 上注册免费试用 Rank Ranger 平台。