昨天(12.18)在写了一个文章:<购买网站应注意的九个问题>
文章首先发布在了落伍者,然后发布到了艾瑞网,又发布在了站长网,最后找朋友发在了挖新闻网。
下午五点的时候三大引擎都收录了.只是排名都不相同.
今天由这个很小的切口来看一下.各大引擎对于原创文章的抓取入排名情况.
以下搜索的截图时间为 12.19 上午11点.
全部是以 "购买网站应注意的九个问题" 带冒号的方式搜索出来的结果.
首先看一下百度.
估计这个排名.多数专业人士看了之后会符之一笑.
可以看的出来,百度对于文章的排名是按时间顺序排的.文章的开头我提到了发布顺序.
至于为什么把那上面的不知名博客排在第一个.我想唯一的解释就是百度蜘蛛最晚一个
抓取到了文章吧.可以从快照里又看出问题.有证证据噢...
我在那个文章中的第二段文字中举了一个例子,原文是这样的:
“我通过这个网站曾成功的购买了一个非常好的域名:www.99wol.com 查看其它历史在2005年的时候曾经是一个机械类网站。”
当发布在站长网以后,编辑可能感觉我AD了.于是把上面的域名中的.(点)刻意改成了 。(句号)
而这个快照里的就是句号.
可以肯定的说.此文章是在12.18号上午10点以后复制过去.或者采集过去的. (因为10点的时候,11544.html">我联系编辑改了那个句话)
所以,换句话说,排在第一个的地址.是最后发布文章的.
而从这个小切口,我们可以看出,百度在排名上对于时间的先后非常看重.最后发布的经常能获得好排名.
百度对于文章的抓取速度还是比较快的,但是对于是否原创,在哪里首发.好像并没有作处理.
其实这样的例子也非常多了.如果有自己发过原创文章的朋友,你们现在在百度搜索一下你文章的名字.
估计一般不会排在第一个,除非转载率极低的.
再来看一下GOOGLE
前两天看过小鹏的一篇文章:Google在处理内容原创性问题
其中有句话是说:这样的做法就是说,谁先发出,即刻给排名,后面收录的不管你是权重多高的站点,都在该原创之下。
看来GG要作到这一点,还需要一点时间...
如果单从这个截图上来看,好像GG和百度差不多.发布最晚的那个.或者说被最晚抓取的那个.排在了第一
上面的挖新闻是19小时前,而站长网则是23小时前...
站长网的文章.排在了后面.
如果按"谁先发出,即刻给排名" 那应该是落伍排第一...而落伍也在后面.
原创文章的处理及排序确实是引擎急需解决的一个问题.
但是排名中并没有出现,像百度图片当中那些不知名博客的排名..全部是有一定知名度的网站.
看来.GG排名中更加看重的是网站的权重.
最后来看看YAHOO
说实在的,平时确实很少关注YAHOO引擎.或许是来流量实在是不大的原因吧.
只听说有专门作GOOGLE的,有专门作百度的.很少听说有专门研究YAHOO的...
从这截图上可以看的出.YAHOO也比较重视抓取的时间与网站的权值.
而至于排名中没有抓取到站长网的文章.我实在有点意外...
从这个文章的小切口,可以看的出三大引擎对于原创文章的排名因素方面,文章的抓取时间起着非常重要的作用.
作出这几个截图来看.基本上可以确定.
三大引擎对于文章的排名,都是抓取最晚的排在前面.其次再看网站的权重.
当然这只是一个小小的实验.而且这个实验是在文章发出一天之后查看的.相对来说观察时间还是比较短的.
或者在过几天,会重新排序一下.也说不定....后面几天会怎么样.谁都不知道..