什么是页面内容重复?

这个问题指你有一个或以上的页面内含有完全一样的内容,这个问题可能来自伺服器设置、CMS或在多个页面添加一样的内容。

为什么这个问题值得关注?

重复的内容是很严重的网站问题。以前搜索引擎并无法分辨这些问题,但近年它们将重复内容在它们索引的排除作为首要任务,同时也开始对含有重复内容的网站进行降权。防上重复内容是SEO其中一个最首要解决的问题。

重复内容的危险

  • 浪费 抓取额度 - 搜索引擎的资源有限,所以它们只会抓取他们想抓取的内容。在某网站上能够被抓取页面的总数名为"抓取额度",和任何有限的资源一样,他们必须按优先性分类。理想而言我们希望搜索引擎先抓取和收录我们网站内最重要的页面,而非不重要或重复的页面。因此若你的网站有大量的重复内容,搜索引擎的抓取额度有机会会大部分被用作抓取页面的重复版本。
  • 降低排名和排除收录 - 搜索引擎非常讨厌浪费他们资源和为用户带来微小价值的重复内容,这也可以是低价值、 薄弱内容网站的讯号。因为这样,近年很多搜索引擎都用重复来容作为一个排名因素,打击不受欢迎或带重复内容的网站。这不仅会影响到重复内容的页面,整个网站的排名都有可能会因为这样而被下降甚至被移除收录。这正在2011年头 谷歌的Panda更新 的用意。

如何修复

相同内容页的修复有几个方法:

  • 选择一个首选的内容页面首选(canonical)页面,并在其他重复页面使用 301重定向指到该页面。
  • 选择一个首选的内容页面URL 首选(canonical)页面, 并在其他重复页面加上rel=canonical标签指往该首选页面。
  • robots.txt档meta robots标签x-robots标签排除重复内容页面的抓取。
  • 修改重复内容页的内容令每个页面都有其独特的内容。
Did this answer your question?