&">nbsp; 重复内容始终是一个经常被谈论的话题。我们不断地发表关于这方面的文章,人们也在不断地提出问题。特别是,我还听到有很多网站管理员担心自己受到了“重复内容处罚”。
在这里请允许我们把这个问题一次性跟大家讲清楚:根本不存在所谓的“重复内容处罚”。至少,也不是大多数人谈论时所认为的那样。
有一些处罚是和抄袭其他网站的内容有关的,比如完全抄袭并且发布其他网站的内容,或者在完全没有提供任何其他附加价值的情况下发布这些抄袭的内容。这些都是我们不提倡的做法,您可以在网站管理员指南里找到有关此问题的清晰的论述:
1、请不要创建含有大量重复内容的多个页面、子域或者域。
2、请避免使用那种“一个模子印出来”(cookie cutter)的方式创建网站,比如没有或者很少原创内容的联属计划。
3、如果您的网站参与联属计划,请确保您的网站可提供附加价值。提供独特且相关的内容,使用户首先有理由访问您的网站。
然而,在某些情况下,为操纵搜索引擎排名或获得更多的访问量,某些网站所有者会故意在多个域内安插重复内容。此类行为即属于欺骗性行为,这会导致非常糟糕的用户体验:用户在一组搜索结果中会看到大量相同的重复内容。
Google 会尽量使用不同的信息来编制索引以及显示网页。例如,这种过滤方法表示,如果您网站中的每篇文章都有"常规"和"可打印"两种版本,并且 robots.txt 或 noindex 元标记都未拦截任何一个版本,那么,我们会选择列出其中一种版本。如果 Google 认定显示重复内容是为了操纵我们的排名并欺骗我们的用户,尽管这种情况很少出现,我们也会在将此类网站编入索引和对其进行排名的过程中做出相应的调整。这样一来,网站的排名可能会受到影响,或者我们可能会将网站从 Google 索引中完全删除,网站删除后将不会再显示在搜索结果中。
大部分的网站管理员都已经知道重复内容能给网站的排名带来负面效应。但是怎样才能检查某个特定的网站是否存在这个问题,并且怎样才能减少或者避免它呢?
从一开始,可以将重复内容划分为两个主要的种类:
网站结构导致的重复内容
内容盗窃导致的重复内容
关于网站结构导致的重复内容
一些网站结构本身会引起重复内容,实例如下所示:
打印友好(ptint-friendly)的页面
在多个页面上具有大体相似的内容,而能通过不同的URL地址访问
页面上有非常类似的单元,比如在一个电子商务种类中,一连串不同颜色的衬具有相似的描述
页面是一个追踪应用程序的会员程序的一部分,且这个程序配置不正确
多个页面有重复的标题或重复的meta标签值
在URL地址中使用会话ID
标准化问题
为了查找网站结构导致的重复内容,可以使用site:www.yingyuxuexi.org.cn查询串来检查已被搜索引擎索引过的网站的URL地址。所有主要的搜索引擎(Google,Yahoo!,Microsoft Live Search)都支持这个功能。通常,“打印友好”的页面如果被索引的话,就会很快显示出来。