使用规范 URL

已发表: 2015-06-30

您可能听说过规范 URL,但不确定它是什么? 以及如何使用它?

放轻松,这篇文章将为 Canonical URLs 打下一个清晰的基础

规范标记只不过是添加一个 HTML 元素到html 页面的一部分。 这有助于 Google 通过指定单词“Canonical”来识别重复内容,Google 将识别页面的首选版本 (URL)。 它也受到 Yahoo 和 Bing 的支持

对于谷歌来说,显示相关页面是最重要的,谷歌面临的主要挑战之一是避免在分析的搜索结果中显示重复页面。 规范标记可帮助 Google 识别重复页面并仅显示相关页面。 规范标记的基本目的只是将重复的内容排除在搜索引擎索引之外,同时巩固首选页面的强度。

在我们深入之前,需要知道内容重复出现的条件。

在 Internet 上,在以下情况下可能会出现重复内容问题。

1) 可以从不同的 URL 访问相同的内容

即使它们代表相同的内容和页面,也可以被搜索引擎视为不同的页面。

2)另一个经典的例子是同一页面有不同的URL,但内容以表格格式显示,结果排序不同。

3) 当站点配置为在 https、http 或非 www 版本上显示结果时。
搜索引擎将上述三个不同的 URL 视为不同的 URL,尽管它们都具有相同的内容。

4) 一个人可能为博客创建的内容在其他网站上联合发布或全部或部分复制。

示例:假设 blog.eduristine.com/first-post.html 也在其姊妹站点 www.edpri.com/blog/first-post.html 上联合发布,虽然内容相同,但搜索引擎可能会将其视为完全不同的 URL。

那么这是如何实现的呢?

让我们以 Flipkart.com 上的真实案例为例

通常在电子商务网站中,单个产品页面可能会根据用户会话、搜索偏好、排序等动态 URL。

例如:以下所有页面显示主要在 Flipkart 上的 Moto E 产品具有不同的 URL

• http://www.flipkart.com/mobiles-accessories/pr?p%5B%5D=sort%3Drelevance&sid=tyy&filterNone=true&q=moto

• http://www.flipkart.com/mobiles-accessories/pr?p%5B%5D=sort%3Dpopularity&sid=tyy&filterNone=true&q=moto

• http://www.flipkart.com/moto-e-1st-gen/p/itme7zd2zsjgbhxg?pid=MOBDVHC6XKKPZ3GZ

• http://www.flipkart.com/moto-e-1st-gen/p/itme7zd2zsjgbhxg

但所有这些页面都指向单一产品,即 Moto E。

对于 Google 和 Flipkart 而言,识别所有这些页面属于同一产品/服务非常重要,并且由网站管理员帮助 Google 识别所有这些页面,哪个是首选页面。 此首选页面将显示在搜索页面中。

这里 http://www.flipkart.com/moto-e-1st-gen/p/itme7zd2zsjgbhxgURL 是首选页面,因此在上述所有页面中都添加了以下 html 标签

有了这个谷歌识别并给出偏好搜索结果到上面的页面。
请参阅下图以供参考。

Flipkart 的规范标记

一看到moto-e产品的源代码,所有页面都有相同的Canonical Tag

请参阅下图以供参考。

Flipkart 的规范标记

规范标签的优点

1. 使用规范标签有助于谷歌将重复和相似的内容页面链接在一起,以便谷歌可以将不同页面下的信息整合到单个首选页面下。

2. 规范标签还帮助我们获得更好的跟踪指标,因为很难跟踪同一内容的多个 URL。

3. 规范标签有助于确定用户想要查看的 URL。

4. 规范标签有助于解决在各种域上发布的 URL 内容联合到首选 URL

除了 Flipkart 案例研究中显示的示例之外,可以/必须按照 Google 的建议执行以下操作来提高搜索可见性

1.在网站管理员部分设置您的首选域

在网站的谷歌网站管理员中,可以设置他们的首选设置
即,一旦完成这些设置,Google 将首选搜索结果的选定版本

2. 使用带有 rel=”canonical” HTML 链接元素的首选 URL html 标签

参见上面的 Flipkart Moto E 示例

3. 对 URL 使用 301 重定向

例如; 在页面中,例如

可以选择一个页面作为规范,其余的可以重定向到所选的规范页面 URL。

4. 正如 Google 自己所提到的,对于规范链接,Google 首选 HTTPS 而不是 HTTP,除非存在以下冲突信号:

• HTTPS 页面的 SSL 证书无效/包含不安全的依赖项

• HTTPS 页面是机器人(而 HTTP 页面不是)。

• HTTPS 页面将用户重定向到或通过 HTTP 页面。

• HTTPS 页面有一个指向 HTTP 页面的 rel=”canonical” 链接。

• HTTPS 页面包含一个 noindex robots 元标记

可以通过采取以下任一措施来确保这种行为:

o 添加从 HTTP 页面到 HTTPS 页面的 301 或 302 重定向。

o 添加一个从 HTTP 页面到 HTTPS 页面的 rel=”canonical” 链接。

5.管理URL中的动态参数

可以通知 Google 忽略 URL 中的某些参数

即价格范围(URL 字符串中的“From to To”或 URL 中的会话 id)

6. 在非 HTML 页面(PDF 等)的 http 标头中使用规范链接

在网络服务器中进行一项配置,其中通过在 http 标头中使用 rel=”canonical” 来

指示 HTML 文档、PDF 等的规范 URL。

在这种情况下,可以使用 rel=”canonical” HTTP 标头向 Google 指定 PDF 文件的规范 URL,如下所示:

rel =“规范”

规范标签对 SEO 非常重要,因为它直接帮助谷歌搜索算法,因此规范标签在谷歌算法中具有重要意义。

规范 URL 对于电子商务公司、内容繁重的网站和搜索流量很大的网站非常重要

希望这篇文章能回答你所有的疑问。 如果没有,请发表评论,我会尽力消除您的所有疑问。