什么是Rel=Canonical?

rel=canonical标签是一条可以在页面原始码的 head中找到的HTML元素,用作防止重复内容 问题。

一般的rel=canonical标签:

有时候一个页面的内容可以透过不同的URL获取,特别是使用 URL参数或者在一组非常相似的页面, 抓取收录 其中一个就可以。 rel=canonical 是一种可以让站长告诉搜索引擎一组页面中那一个是首选页(也称为"canonical"页) 及应该被 收录

例如: www.example.com/blue-widgets?sort-asc 是一个产品列表页, www.example.com/blue-widgets?sort=desc 也是产品列表页,但顺序是反转的, www.example.com/blue-widgets?sort=asc&source=ppc 也是拥有一样的内容,不过附加了流量来源的URL参数,如果这三个页面都被收录,它们便会被认为是 重复内容.

,所以你应该在这三个页面上都加上Rel=Canonical标签。 www.example.com/blue-widgets?sort-asc 是这几个页面的 Canonical 版本,搜索引擎知道它应该收录这个页面并无视其余两个,进而解决重复内容的问题

什么是 Rel=Canonical 为空或缺失?

在下面表格出现的URL源码内都不含rel=canonical内容。这可能有两个原因-整个标签缺失 或 Href 值为空(如:<link rel="canonical" href="" />)。

为什么你需要关注

没有 rel="canonical" 标签不代表你的页面有重复内容,但当你有多个页面有重复或类似的内容时,没有 rel="canonical" 很有可能会导致重复内容的问题,对 SEO 是非常不好的。

重复内容的危害

  • 浪费抓取额度- 搜索引擎的资源有限,所以它们限制不同网站的抓取限度,搜索引擎允许抓取页面的数量就是"抓取额度",它和所有有限的资源一样,都需要按优先级分配。最理想的状况是我们让搜索引擎先抓取网站内最重要的页面,然后才抓取不太重要/重复的页面。这个时候若rel=canonical标签未能正确使用,搜索引擎有机会会把大部分的抓取额度用作抓取重复的页面,而非独特的页面。所以我们需要透过rel=canonical标签,让搜索引擎只抓取和收录网站的独特页面。
  • 排名降低或移除收录 - 搜索引擎非常讨厌浪费他们资源和为用户带来微小价值的重复内容,这也可以是低价值、 薄弱内容网站的讯号。因为这样,近年很多搜索引擎都用重复来容作为一个排名因素,打击不受欢迎或带重复内容的网站。这不仅会影响到重复内容的页面,整个网站的排名都有可能会因为这样而被下降甚至被移除收录。这正在2011年头 谷歌的Panda更新 的用意。

有时候这个问题是由于使用有自动加入rel=canonical标签到页面功能的CMS,插件,模板或程序无意导致的。

如何修复

如果你发现下面列表的URL中有内容非常接近的情况,你则需要采取行动,决定那个页面应是 canonical 版本并在所有类似页面中加入一样的 Rel=Canonical 标签。

Did this answer your question?