从百度的官方文件,可以看到,搜索引擎一直在鼓励原创内容。但是,对于一个大型网站来说,所有信息都原创是不可能的,如何解决网站的重复内容,让搜索引擎相信,网站的内容都是原创的。今天,Q猪也讲一下,网站如何去重重复内容,最大限度的保持网站内容的原创性。
要解决如何去重,恢复原创,首先需要了解,重复内容产生的原因
第一、网站内同一内容,不同URL。比较典型的有,网站出现的三类地址,动态、静态、伪静态
第二、产品说明来源相同,且没有改动。比如服装网站,内容来源都由供货商提供
第三、产品说明、付款申明等内容,有打印版本,且没有禁止搜索引擎蜘蛛抓取
第四、由于产品下拉菜单产生的相同页面,比如根据网站的价格、上架时间、成交量等条件,产生的产品排列页面
第五、网站公共部分太多,导致页面实际内容所占的比例太少
第六、转载、抄袭、复制页面
第七、网站页面本身区别较小,比如同一地区的酒店介绍,相似度太高
第八、页面地址,添加任意字符后,没有404页面,而是和正常地址下,拥有相同内容
查询网站是否有重复内容,可以从内部和外部两个方面着手,最简单的一种方法,就是在正文中,截取一段内容,放入搜索引擎中搜索,就可以发现是否存在重复内容。
为什么要去除复制内容
分析:首先必须要明白的是,网站存在少量复制内容,不会引起搜索引擎的惩罚,只要总体上以原创为主就可以。那么,为什么还要去除重复内容呢?原因有以下几点:
首先针对的是,网站内部相同内容,如果有几种链接的情况
第一、搜索引擎在索引排名时,只会给一个链接,但是无法保证,有排名的地址,就是你在优化的地址,从而导致优化工作的无效率化。
比如在Q猪文学站初创时,有三种地址:动态、静态、伪静态,作为一本流行的言情小说庶女有毒,一般优化的地址都是http://www.qzread.com/booklist/1/1079/,
但是如果没有把网站的动态和静态地址屏蔽掉,在网站排名时,给予的地址不是优化过的伪静态地址,而是其他两个,前面的优化工作,就成为了徒劳。
第二、分散网站权重
一篇独特的、有价值的内容,虽然出现有多个网站地址,但是还是可能会同时出现在搜索引擎的排名中,但是这样势必造成,分散到每一个地址的权重会降低。
第三、减少收录
搜索引擎蜘蛛理论上会尽可能多的爬行,网站的每一个链接地址,但是会受到网站权重等的影响。在权重较低的情况下,如果网站内部,相同内容的地址太多,就会阻碍收录其他页面的时间,从而减少了网站收录更多的页面。
第四、重复页面严重,会导致惩罚
如果网站中,大量页面都出现了,内容的重复,就会导致搜索引擎对网站页面质量的不信任,评分也会降低,从而导致网站的惩罚。
如果去除复制内容
第一,同一个网站内出现,复制内容,多种链接地址的情况。最好的办法,就是确保每篇文章只对应一个URL,在网站中,不要出现其他链接形式,必要时,对其余形式,进行robots文件禁止,及301转向。
第二,如果是不同网站中,出现重复内容。首先在文章中,加入版权申明,转载请注明原创出处。
另一个方面,就是坚持原创,搜索引擎会根据网站,其他内容的原创度,给网站内容加分
第三个方面,对所有内容做好内链,如果网站拥有完美的四处一词,搜索引擎也会对内容进行加分
最后,如果情况很严重,可以联系下,对方站长,要求停止,原创内容的转载,或者申明原创出处。
百度也在倡议,为了互联网的健康发展,鼓励所有站长进行原创,同时还推出了鼓励原创的星火计划。关于如何去除重复内容,由好看的言情小说(http://www.qzread.com/)原创发布,转载请注明出处。