关于网站的重复内容,10个建议

一直很在意网站重复内容的影响和规范,今天在朱健飞的博客上看到了关于重复内容的描述,之前已经有读过英文版本,这次的中文翻译非常好读,以下是全文外加Chris.DL的心得:)

最近,搜索引擎战略会议在寒冷的芝加哥举行。许多谷歌参加者总是被问及关于重复内容的问题。对于这个话题,我们发现有许多破碎的并且有些混乱的理解。我们想在此予以澄清。

什么是内容重复?

重复的内容一般是指在不同域名间存在大量的相同或相似的内容。很多时候,它并非故意或至少本无恶意。譬如说,有些论坛会生成一些专为手机屏幕的页面;商店物品被显示在(有时甚至是链接到)多种不同的URL上,等等。但有些时候,一些网站为了操纵搜索引擎排名,获得更多流行或长尾查询的访问量,大量地从其他网站复制内容。(Chris.DL:一般网站的重复内容有3种情况,网站本身的内容重复;网站因为URL的设置问题导致的内容重复;网站内容采集)

什么不是重复内容?

虽然谷歌网站有方便易用的翻译功能,我们的算法不会把有着相同内容的英文版和西班牙文版看作内容复制。同样,你不用担心我们把你文章中对其他文章小片段的引用认定为重复内容。(Chris.DL:大片段的引用算不算呢?这篇文章算不算重复内容呢)

为什么谷歌关心重复内容?

谷歌用户使用Google时通常希望看到多样化的原创内容。如果他们找到的都是内容相同的一堆搜索结果,可以想见那是多么烦人。另外,网站管理员不愿意看到Google给出象example.com/contentredir?value=shorty-george〈=en一样复杂的URL。他们往往更喜欢类似example.com/en/shorty-george.htm的URL。(Chris.DL:因为URL设置导致的重复内容是非常冤的一件事情)

谷歌做了些什么?

Google在抓取网页和获得搜索结果时,总是力图索引并显示内容不同的页面。这种过滤意味着,譬如说,如果你的网站有文章的正常版和打印版,并且你没有在robots.txt里设定noindex标记,谷歌就只会选择一个版本显示给谷歌用户。对于企图利用复制内容来操控排名,欺骗谷歌用户的少数情况,我们会在对相关页面的索引和排名作出适当调整。当然,我们更愿意把重点放在过滤而不是排名调整上… 因此,在绝大多数情况下,最坏的结果就是原创者看到了不愿看到的版本出现在我们的索引里。(重点放在过滤而不是排名调整上)

网站管理员如何主动处理内容复制问题?

1、适当阻止搜索引擎访问:与其让我们的算法来确定一个文件的”最佳”版本,你也许希望指引谷歌选取你的首选版本。譬如说,如果你不想我们索引你网站文章的打印版,你可以在你的robots.txt文件中写上目录名或正则表达式来禁止谷歌对那些打印版的抓取。

2、使用301重定向:如果你已经重构你的网站,请在你的原网站的.htaccess中使用301重定向(永久性重定向)来重定向你的用户、Google爬虫、以及其他搜索引擎蜘蛛等。

3、链接要一致:努力使你的内部链接保持一致; 千万不要既有/page/,又有/page和/page/index.htm 的内部链接.。(Chris.DL:可以将/page/index.htm用301重定向到/page/)

4、使用顶级域名:为了让我们总是使用最合适的文件版本, 请尽可能使用国家特定的顶级域名。与诸如example.com/de或de.example.com的URL相比,谷歌肯定更清楚地知道example.de是以德文为核心的内容。

5、小心辛迪加式的联合供文:如果你为其他网站上也提供你的内容,请在每一个其他网站的文章中包括连回原文章的链接。注意:即使是这样,对一个查询,谷歌总是显示我们认为是最适合的(没被网站禁止的)版本, 它可能是,也有可能不是你所想要的版本。

6、使用谷歌网站管理员工具的首选域功能:如果其他网站链接你的URL时既使用www版本又使用无www的版本,你可以用谷歌网站管理员工具让我们知道你想要哪种索引方式。

7、减少模板网页上的重复内容:拿版权声明来说,你有两种选择,一种是在你的每一个页面底部都有一个冗长的版权声明。另一种是设立一个专门的版权详细声明页,然后在每页底部写一个非常简短的总结,并链接到版权声明页。

8、避免发布无内容页:用户不喜欢看到无实际内容的页面。要尽量避免空架页。以房地产网页为例,不要发布(或至少要阻止)没有点评的点评网页,或者没有房地产列表的房地产罗列网站等。只有这样,网站用户(以及Google爬虫)才不会看到无穷多的写着“以下是在【某城市名】中不可错失的待租房列表…”但其实根本没有什么列表的网页。

9、了解你的内容管理系统:确保你熟悉你的网站是怎样显示内容的,尤其是当它包括了博客,论坛,或相关的系统。往往在这些系统中同一内容会以多种形式出现。

10、不要担心,保持快乐:不要过分受搜刮(挪用和转载)你内容站点的干扰。虽然很恼人, 它们几乎不可能对你在谷歌中的存在产生负面影响。如果你实在忍无可忍, 欢迎你提出千禧年著作权法案申请 来声明对你的内容的所有权。我们会处理那些无赖网站。

总之, 如果你对内容复制问题有一个大体的认识,又能花上几分钟有见地地预防性维护一下你的网站,这将既帮助你们,也帮助我们为用户提供独特而相关的内容。

时间: 2024-08-22 13:21:03

关于网站的重复内容,10个建议的相关文章

电子商务网站优化必备的10个建议

电子商务网站竟争也是趋激烈化,你的网站优化的如何,是不是有些过度优化,或是根本没有优化,电子商务网站优化需要注意什么呢?客户之所以访问你的网上商店是因为有想从你这买东西的打算,所以客户所需要的就是我们帮他找到他在寻找的东西,并且将他从A点(产品页)带到B点(结账页).如果我们给他明路,我想客户会愿意购买我们的产品的.所以说电子商务网站优化你需要必备以下十五个 建议,相信你做到这十五条,你网店的生意会越来越好! 1.避免多余的注册过程.不必要的注册步骤或者是其他会减慢用户支付的无用信息,要去掉,你

简析网站权重的隐形杀手 重复内容

大家都知道网站改版,同IP网站出现问题,或是自己的网站被攻击等都会让自己的网站降权,但还有一个因素同样会影响网站的权重,那就是网站的重复内容,网站中如果充斥较多的重复内容必然会影响到网站的权重以及排名,所以做好这方面的防备是做好SEO的重要举措. 什么情况会产生重复内容? 1 采集内容.这点大家都容易理解,很多站长为了省下写内容的时间,就去别的网站采集一些内容来填充自己的网站,这样做肯定会造成网站之间重复内容增加,而且对于这样做的后果大家是心知肚明,但还有很多站长存在侥幸心理,不过对此笔者建议大

如何处理网站重复内容和多域名问题

在企业网站建设过程中,管理层一般会思考很多网站域名问题以及网站内容问题,在此之前,我们公司的网站"淘居乐"曾经遇到过关于内容的重复和多域名的问题,现在想与大家分享下.我们的网站淘居乐上线于2009年10月,由于刚上线之前曾经有个网站即将到期,就启用了"taojule"的域名,公司的品牌就变成了"淘居乐",公司领导考虑到长远发展,分别注册了com.net.cn三个域名,但是当淘居乐上线不到一个月,问题来了,因为.com域名内容完全是复制了即将过期的

降低重复内容对网站优化产生的负面影响

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 有很多原因导致相同的的内容刊登在不同网站,重复内容有机会能够让搜索结果显示相同资讯,让搜索结果的质数下降.为避免这情况发生,Google 表示会采取不收录重复内容网页的措施.当然现实之中,大家都经常可发现重复内容的网页出现在搜索结果内,尤以国内网站主.或者可以理解为Google 未算做得太彻底.不过作为内容的原作者,一定不希望自己的网站不被收

网站重复内容危害大 站长需未雨绸缪

互联网的不稳定发展,网友们不能有更多的原创内容,导致网站大多数内容来源采集,互联网垃圾信息被大量的传播着.站长们都知道这样的重复内容并没有好处,即使网站有段时间因为这些内容带来了利益,站长们也要未雨绸缪,减少网站的重复内容,提高网站的整体质量. 为什么会产生重复内容 重复内容是指不同的URL链接内容却是相同的,造成重复内容的原因可能是内容的采集,直接使用采集工具采集其他站点内容;网站因为网址不规范,导致网站有多个URL地址可以访问,蜘蛛也同时收录多个重复页面;网站没有设置404错误页面,默认所有

网站内容优化之如何避免重复内容

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 网站的重复内容,小左一直比较关注这方面,Google官方一直宣传和提醒网站管理员,需要注意网站重复内容的问题.Google为什么要这样做?一是会影响用户的搜索体验.二是会增加程序负担.所以,今天与大家分享一下,如何在网站内容优化方面通过细节的控制,尽量避免重复内容. 首先的有一个内容丰富的网站,这是你进行seo优化的基础.俗话说的好,&quo

使用.ashx文件尽量避免各种重复内容

摘要: 不同的链接指向的页面如果具有大量相同的内容,这种现象就会被称为重复内容,如果一个网站的重复内容很多,搜索引擎就会认为这个网站的价值不高.所以我们应尽量避免各种重复 不同的链接指向的页面如果具有大量相同的内容,这种现象就会被称为"重复内容",如果一个网站的重复内容很多,搜索引擎就会认为这个网站的价值不高.所以我们应尽量避免各种重复内容. 动态网站的重复内容常常是由URL参数引起的,而URL重写会恶化这一现象(比较耐人寻味哟,呵呵).因为如果使用的是原始的URL参数的话,搜索引擎可

ASP.NET教程:使用.ashx文件去除重复内容

不同的链接指向的页面如果具有大量相同的内容,这种现象就会被称为"重复内容",如果一个网站的重复内容很多,搜索引擎就会认为这个网站的价值不高.所以我们应尽量避免各种重复内容. 动态网站的重复内容常常是由URL参数引起的,而URL重写会恶化这一现象(比较耐人寻味哟,呵呵).因为如果使用的是原始的URL参数的话,搜索引擎可能会进行适当的判断,而得知重复内容是由URL参数引起的,自动的进行相应的处理:而URL重写会掩盖URL参数,反而使得搜索引擎无法识别URL参数.比如: 原始的URL:htt

实例解析处理网站重复内容的最佳方案

所有的网站都无法避免产生重复内容的问题,这是网站运营过程当中的一个通病.如果一个网站存在大量相似或者相同的内容,可想网站的用户体验和搜索引擎友好性都将大打折扣.严重的还将会被搜索引擎视为垃圾站而无法获得良好的收录和排名.通过谷歌管理员工具对网站重复性内容进行分析之后,发现造成网站内容重复的原因有如下几种情况: 1. 重复更新内容:这是网站编辑在上传文章的过程中多次上传同一篇文章所致,归根到底是没有写重复标题验证功能; 2. 多处调用同一篇内容:动态地址伪静态会产生两个不同URL但内容相同的情况,