最近一段时间以来,百度可谓是动作频频,绿萝算法、百度自身产品nofollow、百科取消扩展阅读、某些特定行业如医疗百科词禁止普通用户编辑、百度LEE发布谈外链判断、百度星火计划、和中消协合作等,一系列的举措都是为了提高百度搜索结果的真实性,可读性,权威性。尤其是最近正在测试的的星火计划,大有力推原创,清除互联网垃圾的架势。
相信大家已经注意到了,对于原创文章一部份平台已经给予了特别的标注,让用户清楚的知道那些文章是原创,那些不是,当然现在还全没有全部推广,只是一部份特殊的平台,如新浪,搜狐等大平台,至于将来会不会全行业推广,也落到我们普通用户的网站上,这个还不得而知,但至少说明这方面的工作已经在开始启动了,对于我们SEO来说,区分文章的标准:原创,伪原创,抄袭等。说起来简单,但是真正对于搜索引擎辨别起来,要怎么认定,现在也还没有一套行之有效的办法,比如有的人说我写了一篇文章发布在自己网站上,但是由于自己网站权重低,收录慢,然后文章被别的高权重的大平台转载去了,结果他们变成了原创,自己反而变成了抄袭了,原创重视内容建设这个百度已经提了很久了,不过还是迟迟没有落实,还有人说根本就行不通,但是现在有一个惊喜的发现。
图中圈住的部份,大家仔细看下,快照时间等于发布时间,上面是其中一个关健词,我也测试了其它的好些的关健词,发现在站长之家上都是这样的,还发现了其它的一些平台也是这样,大家不妨可以自己去测试下。
同样的文章如上图,站长之家和另外二个网站出现了三个不同的快照,假设我们用发布时间来判断,谁是原创,谁是抄袭已经清楚了吧。也就是说将来有可能所有的站有可能出现同站长之家一样的情况就是发布时间等于快照时间。同样的文章,发布晚的那就可以被认定为是抄袭,发布时间早的就是原创,同样的回到最初上面提到的,如果你的一篇文章发布在自己网站上然后因为权重低收录慢的原因,被人家抄袭去先收录了,假设后来你的这篇文章也同样被收录了,这时根据发布时间来判断,你的发布时间肯定早于抄袭者,你的快照肯定早于抄袭者的快照,所以自不然认定你的就是原创了。当然说到这里,有人可能要说这个简单了,我把我电脑的时间改掉就可以了,然后就比对方早了吧,相信这点百度可能也早就想到了,你能控制你电脑的日期,但是你控制不了蜘蛛的抓取时间吧,相信百度会对这二个时间进行比对的。
而且这样让快照时间归位,也可以明显的提高用户体验度,按照目前的快照生成办法,快照是可以随时更新的,比如说你发布的同样一篇文章在百度数据库里快照会随着数据库更新时间而更新的,比如说你二年前的一篇文章,到今年的时候你去看快照一定不是二年前的,有可能是前段时间的,当我们用户去搜索的时候,尤其是搜索一些时效性的词,首先你看了百度索引你肯定不知道这篇文章到底是最近发布的,还是很久以前的老文章了
如上图,当你搜索如何提高网站排名这个关健词,你肯定是是想搜索最近一段时间如何提高网站排名的方法,排在一起的展示的三个搜索结果,第三位展示结果的那篇,快照时间是2013-3-30,而站长之家的是2012-9-25,第一印象你肯定感觉第三位展示的那篇应该是讨论的最近的提高网站排名的办法,所以你点进去了,居然是2010的文章,时间更久远,谈的也是2010年当时的提高网站排名的因素,跟当下一点关系也没有,如下图
这样是不是影响了你的搜索体验度,相反站长之家那篇比起来相对还要新些,你反到认为时间更久,而不去点击阅读,试想一下,如果将来那一天快照时间都和发布时间统一了,谁先谁后是不是一目了然了,你就可以很轻松选择搜索结果了,这一点在百度自身的问答产品和一些可以评论的程序上已经开始体现了,误导和误搜已经可以最大化的避免了,
相信不用我多说,从上图的展现结果来看,你已经能判断那条才是你最想要的搜索结果了吧,如果上图的展现是发贴时间等于快照时间。相信你会看得更加清楚。
以上纯属本人推测,也不能代表百度官方观点,所以可能存在对与错的问题,所以在这里提醒大家思考性的阅读,以免被误导,相信大家都是有自己的判断力的,如果有不同观点的,可以留言发表自己的观点,共同讨论,如果想进一步的交流,请登陆http://www.suzhanscale.com/查询相关的沟通方式。