您需要了解的有关规范标签 SEO 的知识
已发表: 2022-02-22如果您不精通技术,那么规范标签 SEO 对您来说可能听起来既复杂又古怪。 但是,它是搜索引擎优化库中的重要工具,在管理重复内容时不可替代。 通过了解规范服务的目的以及如何正确使用它们,您可以更好地优化您的页面并保持链接公平。
与 SEO 的任何其他方面一样,围绕规范可以做什么和不能做什么以及应该如何使用它们有很多猜测。 由于这些类型的标签已经存在了十多年,因此互联网上流传着许多过时和误导性的信息。
因此,在本文中,我们将讨论您需要了解的有关 2022 年规范标签 SEO 的所有信息。继续阅读并做笔记!
什么是规范标签?
规范标签是可以放在页面 HTML 头部的代码片段。 当网站的 URL 具有相同、相似或密切相关的内容时使用它们,并用于通知搜索引擎哪个是最重要的。
规范链接标签如下所示:
<link rel=”canonical” href=”https://example.com/text/text-text” />
标记内的链接是主页的 URL,根据 Google 的规定,应该是绝对 URL,而不是相对 URL。 这意味着您必须使用页面的完整地址,包括协议、域和内容在您网站中的位置:
<link rel=”canonical” href=”https://example.com/text/text-text” />
代替
<link rel=”canonical” href=”text/text-text” />
哪些类型的页面需要规范标签?
即使您没有明显重复的内容(例如重复页面),您仍然可能有重复的 URL,这可能会使机器人感到困惑,并且可能会导致索引受挫。 这些可能是由您的内容管理系统 (CMS) 创建的,由您使用路径的方式不一致、协议问题等引起。
因此,让我们看一下可以从规范标签 SEO 中受益的页面类型,以及在每种情况下如何进行:
HTTP / HTTPS
Google 优先考虑 HTTPS 协议,因此,默认情况下,如果您的页面同时具有 HTTP 和 HTTPS 版本,并且没有从前者重定向到后者,则机器人会将 HTTPS 版本显示为规范。 如果您不想使用 301 重定向并完全放弃 HTTP 版本,则应向 HTTPS 添加规范标签。
但是,如果出于某种原因,您希望将 HTTP 版本标记为更重要的版本,则可以为其添加规范标签。 但请记住,尽管有您的建议,Google 仍可能会选择显示安全版本。
万维网/非万维网
对于机器人来说, https://www.example.com/text和https://example.com/text不是一回事。 理想情况下,您应该始终如一地使用 www 或非 www 版本的链接。
但是,您无法确定您的访问者可能在搜索引擎和浏览器中键入什么内容,以及他们可能会添加哪些书签。 规范化其中一个版本将确保机器人知道您喜欢哪个版本,并可能专注于它。
跨域内容副本
如果您像数字出版商那样将内容联合化,或者想要在多个域上发布一篇文章,您应该规范化原始页面(您自己网站上的那个)。
这可以通过将 rel=”canonical” 标记添加到您的页面并要求发布商将其添加到他们的页面代码中来完成,并带有指向原始的链接。 这样,所有的链接汁液和股权将被引导到您的网站。
此外,机器人在多个位置遇到相同的内容,它们不会混淆哪个链接的排名更高。
移动页面
如果您的网站没有响应并且您拥有独立的移动版本,Google 会将桌面和移动 URL 视为单独的页面:
https://m.example.com/text ≠ https://example.com/text
为避免混淆并防止在两者之间分配权限,您应该仅将其中一个设置为规范。 有了移动优先索引,最好规范化移动页面。
但是,您不必担心——如果用户在桌面上键入查询,尽管有标签,机器人仍会显示适当的版本。
AMP 页面
当您拥有内容的 AMP 版本时,最佳做法是将 AMP 页面托管在与原始地址相似的地址上
https://example.com/news
https://amp.example.com/news
在这种情况下,您应该规范化主页并将带有原始链接的规范标签添加到 AMP 版本的代码中。 这样,机器人将更容易识别哪个是主页。
带有搜索参数和会话 ID 的链接
会话 ID 和 URL 参数经常使机器人感到困惑,并可能导致它们无法正确索引您的页面。 如果您无法避免使用这些,则应该规范化主页,以便机器人知道链接地址中的扩展只是那个,而不是新页面。
参数最常用于更好地组织电子商务网站上的内容。 它们向 URL 添加值以指示产品的变化,例如颜色、大小和类型,并可用于应用各种搜索过滤器、活动跟踪信息等。
以下是带有参数的页面的外观:
https//www.example.com/page?key1=value1&key2=value2
代替
https//www.example.com/page
会话 ID 可用于跟踪单个用户在网站上的行为。 例如,在电子商务商店中,ID 可以是 cookie 替代品,用于向网站显示用户访问的页面。 可以使用该信息,以便保留该人的购物车和上次访问的项目,直到他们离开网站。
以下是具有会话 ID 的页面的外观:
https://example.com/index.jsp;jsessionid=07D3CCD4D9A6A9F3CF9CAD4F9A728F44
代替
https//www.example.com/page
理想情况下,机器人应该足够聪明,可以识别参数和会话 ID。 但是,有时他们可能会感到困惑,这就是为什么设置规范标签将帮助他们巩固页面的排名,而不是分发它们。
不同类别下的相同内容
当您的网站上有多个类别下的同一内容时,您将拥有多个具有几乎相同内容的 URL,这些 URL 指向同一页面:
https://example.com/category1/text-text/
https://example.com/category2/text-text/
如果您没有将其中一个页面标记为规范并在内部链接构建策略中始终链接到该页面,则机器人会将这些页面视为重复页面。 它不仅会浪费时间(和抓取预算)来决定向用户展示哪一个,甚至可能会分别对两者进行排名。
自参考页面
尽管听起来可能是多余的,但自我引用是一回事,并且已被 Google 的 John Mueller 证实在回答 Reddit 上的用户问题时具有 SEO 价值:
<link rel=”canonical” href=”b.html” /> 如果这是在 a.html 上,那么它只是一个普通的规范(技术上规范的链接元素),如果它在 b.html 上,那么它是一个自引用一。
由于您不知道人们如何链接到您的页面,因此自我引用有助于清理小错误。 例如,如果一个链接指向 b.html?utm=cheese,那么服务器通常只显示 b.html,并且那里的自引用规范链接元素会鼓励搜索引擎只使用“b.html”而不是“b.html?utm=cheese”。
简而言之,原始页面可以也应该使用 rel=canonical 进行标记,以便机器人更清楚它确实是原始页面。
网站语言版本
如果您的网站有不同的语言版本,您可能希望仅将其中一个定义为规范版本。 在这种情况下,您可以将自引用 rel=canonical 标记添加到您认为是主要代码的代码中,并将其他代码指向它。
为了让 Google 更容易理解为什么两个页面具有相似或相同的内容但不重复,您应该使用 hreflang 标记属性。 例如,如果您的网站有英国英语、美国英语和西班牙语版本,您可以将以下片段添加到各个版本:
链接 rel=”alternate” href=”http://example.com” hreflang=”en-us” />
链接 rel=”alternate” href=”http://example.com” hreflang=”en-uk” />
链接 rel=”alternate” href=”http://example.com” hreflang=”en-es” />
并将英文美国版本标记为规范版本。
但是,请记住,根据用户的位置,Google 将最终决定在哪个页面上显示他们,并且可能会忽略您的建议。
规范标签 SEO 用于什么?
简而言之,规范标签 SEO 的主要目的是管理重复并保持链接公平。 如果出于某种原因,您有多个指向同一页面的 URL,机器人可能会对要对哪个 URL 进行排名感到困惑。
作为人类,您实际上将链接视为同一件事。 但是,对于机器人来说,每个 URL 都有其含义。 如果您不指定您认为哪个更重要,Google 将为您做出选择。 但是,您和 Google 可能对链接的重要性有不同的优先级和不同的理解。
此外,如果您不指定哪个是规范路径,则每个单独的链接将以不同的形式提供给搜索结果中的用户。 这意味着所有的权限和链接汁都将在页面之间泄漏,而不是仅累积在其中一个中。
同样,谷歌将决定接受其中一个页面作为规范,但如果它没有参考说明,理论上,它可能每次都会做出不同的决定。
为什么不应该滥用规范标签?
人们应该仔细使用规范标签 SEO。 如果您出于其他原因尝试操纵机器人或滥用标签(我们将提供示例),您最终可能会混淆爬虫,他们可能会放弃索引您的链接。
此外,大型网站上放错位置的规范可能会耗尽您的抓取预算。 如果机器人不确定您的页面发生了什么,他们会继续尝试找出答案,而不是抓取您发布的新内容。 这将导致他们的工作滞后,并影响您的网站在 Google 搜索排名中的表现。
简而言之,如果你以错误的方式使用规范,你就有可能在没有问题的地方产生问题。
关于规范标签 SEO 的常见误解
以下是关于 SEO 中规范标签的最常见误解。 为了更清楚起见,我们在这里对其进行了总结:
- Google 有义务遵守这些规定。 错误的。 规范是建议而不是规则。 它们可以作为向 Google 建议您认为最重要的重复页面的一种方式。 然而,即使有这些标签,机器人仍然可能会决定另一个页面更合适,并选择它而不是你想要的
- 它们用于按主题对内容进行分组。 规范的唯一目的是帮助机器人整理出重复的 URL。 这意味着如果您有类似主题的页面,但针对不同的关键字并具有不同的内容,则规范标签不是统一其链接资产的正确工具。 如果两个页面相差很大,但通过 rel=canonical 连接,机器人将继续抓取它们,试图了解标签存在的原因,这将不必要地浪费抓取预算。
- 规范标签可以替代重定向。 规范化与重定向的权重不同,因为如上所述,它不是指令,而是建议。 因此,如果您不希望页面可访问或优先考虑,则标签将无济于事
- 您应该始终使用规范。 不必要。 这里的目标是绕过一开始就不应该存在的技术问题。 如果您的 URL 在整个网站中是一致的,并且您没有我们之前讨论过的问题,那么您可能不需要规范标签。 也就是说,如果您不确定,您可以使用 rel=canonical 标签来仅对您最重要的页面进行自我引用,以防万一。
如何将页面合并为规范
尽管谷歌总是在它认为是规范的页面上拥有最终决定权,但仍有一些方法可以强烈推荐您喜欢的页面。
处理过 SEO 的人都知道,Google 使用各种信号来决定如何抓取、理解和索引网络。 如果你使用正确的,它更有可能听你的。
在规范的情况下,谷歌的约翰穆勒说,机器人确实试图阅读网站希望他们做什么。
那么除了将 rel=”canonical” 链接标签添加到您的 HTML 标头之外,如何告诉 Google 您想要什么?
规范化 HTTPS URL
与 HTTP 相比,Google 更喜欢 HTTPS 路径,因为它们具有 SSL(或 TLS)证书并提供更安全的信息传输。 因此,如果您的链接同时使用这两种类型,Google 将被 HTTPS 的一种绘制。
为了避免让机器人感到困惑,让它们在他们知道是正确的事情和你似乎强迫他们做的事情之间做出选择,最好始终规范化 HTTPS 链接。
仅将规范化 URL 添加到您的站点地图
XML 站点地图是您的 SEO 策略中的重要工具,可让您帮助机器人对您的内容进行优先排序和索引。 默认情况下,Google 认为地图中的所有 URL 都是规范的,因为这些应该是您最重要的页面——您告诉它要编入索引的页面。
因此,当您创建地图时,请确保仅添加您认为是主副本的页面。
优化您的网址
机器人还关心您的 URL 的外观。 这意味着用户是否可以轻松理解它们。 由于 Google 倾向于选择 SERP 中显示的内容,因此更有可能避免使用具有混淆参数的链接。 虽然如果这样的链接与用户的查询完美匹配,则可以对其进行排名,但安全总比抱歉好。
仅将内部链接添加到规范 URL
内部链接是向 Google 展示哪些链接比其他链接更重要的好方法。 在向您的文章添加链接时,请确保它们始终被规范化并指向主 URL。 这样,机器人就会知道哪些页面更重要,并认为它们更相关。
使用重定向
当您不再使用其中一个重复页面时,告诉 Google 您不希望它被抓取和编入索引的最佳方法是创建 301 服务器重定向。 这样,机器人将完全跳过过时的页面而选择新的页面,而不是访问两个页面并进行选择。
当您在您的网站上安装 SSL 或 TLS 并且您的所有 HTTP 链接都变为 HTTPS 时,尤其建议您这样做。 创建重定向将确保将旧链接添加为书签或反向链接的任何人都将自动重定向到新的安全地址。 这将使机器人不必自己做出决定。
但是,请记住,通过重定向,Google 和用户都无法完全访问旧页面。 这是一个极端的措施,只有在您真的不再需要该页面但想要保持其公平性时才应使用。 此外,过多的重定向可能会降低您的网站速度。
底线
当您了解规范标签 SEO 并知道如何使用正确的标签时,它并不复杂。
重要的是要记住,rel=canonical 属性的主要目的是管理 URL 重复,并帮助机器人找出不同 URL 指向相似内容的原因。
如果您不精通技术并且需要帮助管理您网站的规范 SEO,请随时给我们打电话!