搜索引擎大比拼:百度蜘蛛最懒,谷歌收录最快

  我给新建的一个垃圾站安放了监测搜索引擎蜘蛛爬行记录的代码,通过2天的监测发现百度蜘蛛最懒,谷歌收录最快。

  大家可以查阅这里监测搜索引擎蜘蛛爬行记录的数据:http://www.38rl.com/robotslogs.txt。自从07月29日监测开始,谷歌蜘蛛、雅虎蜘蛛、MSN蜘蛛、百度蜘蛛都有爬行的记录,(事先我已向各大主要搜索引擎提交了这个网站的),但是百度蜘蛛自从07月29日爬行后,就再也没有来过,而其它几大搜索引擎的蜘蛛都来过许多次。由此可见百度蜘蛛最懒了。

  另外,我分别在几大搜索引擎中通过site:www.38rl.com的方法查询网站的收录情况,谷歌已经收录了9个页面,百度只收录了首页,其它几个搜索引擎收录的页面数不等。据此可见谷歌收录最快,百度收录速度最慢。

  看来,与国外著名的搜索引擎相比,百度在运行效率方面确实有一定差距。但新建站的朋友也不必着急,了解这个规律以后,专心充实网站内容,各大搜索引擎迟早会来光顾的。

  最后,我将监测搜索引擎蜘蛛爬行记录的代码,与大家分享一下,请看http://www.38rl.com/uploads/sebot.txt。

  这个文件的代码挺简单:各大搜索引擎的蜘蛛爬行程序都有自己的标识符,例如谷歌的是googlebot,百度的是baiduspider,它们可以通过查询_SERVER变量中的HTTP_USER_AGENT参数来获取,再结合HTTP_REFERER记录下URL的来源,最后用nowtime()函数取得当前的系统时间,就形成了一条简单的擎蜘蛛爬行记录。

  看不明白的朋友可以跳过,其实代码不是我写的,许多年前网上就有人共享出来了,我们重点学会如何使用就可以了。

  请大家把我上面贴出来的sebot.txt文件另存为sebot.php,当然你可以任意给它取个名字,例如123.php或者aaa.php都行,只要保证扩展名是php,让它能够正常执行即可;然后上传到你的网站程序的模板目录中(例如Wordpress的是/wp-content/themes/ThemesName目录);最后在你的模板文件中调用它,例如在Wordpress博客中,你可以在footer.php文件中添加代码。

  接下来就是等待搜索引擎蜘蛛到你的网站来爬行了,爬行的结果记录在网站根目录的robotslogs.txt中,你直接打开http://www.YourDomain.com/robotslogs.txt就能看到了。当然你也可以修改robots.php文件的第50行,把robotslogs.txt换成任意你想要的名字。

  通过一段时间的监测,你就可以发现搜索引擎蜘蛛在你的网站上爬行的频率了,一般来说,蜘蛛爬行得越勤快越好,我有个垃圾站,谷歌的蜘蛛一天会来爬行几十次。另外,如果你的robotslogs.txt记录的内容太多了的话,你可以清空它重新开始记录。

时间: 2024-10-26 11:06:10

搜索引擎大比拼:百度蜘蛛最懒,谷歌收录最快的相关文章

百度蜘蛛机器人爬与收录量关系

们的网站只要你用心去观察蜘蛛机器人的爬行规律,根据不是阶段认真的作好总结,我想要不了多久,百度蜘蛛机器人会非常喜欢你站的 一.初试期 我在这点说的初试期,指的是网站开通到给百度收录提交过后的一个星期,在这一个星期内,百度蜘蛛机人的活动方式是这样的,首先百度机器人会来爬行的提交网站的首页,然后过一会,在根据它分析的结果,有可能是一天或几分钟过后就在次来爬行,你首页上的其它页面.当然在这个阶段,机器人爬行首页次数会非常少,有可能一天只有几次爬行首页,主要是因为你网站上有很多链接,它得一个一个的爬.机

百度蜘蛛解决内页收录难的问题

摘要: 网站内页收录也是衡量一个网站优化是不是达到合格水平的重要指标,如果一个网站的内页收录情况不理想,那么即使其主页排名到达了首页,流量也是寥寥无几的.但是收录内页的难 网站内页收录也是衡量一个网站优化是不是达到合格水平的重要指标,如果一个网站的内页收录情况不理想,那么即使其主页排名到达了首页,流量也是寥寥无几的.但是收录内页的难度往往要比收录首页高很多,如果网站的细节做得不够好,网站的内页收录是非常艰难的. 当各位seoer还在苦恼你的网站内页为什么那么难收录的时候,可曾想到过,我们的收录的

如何做到新站上线半个月谷歌收录3万

一个网站在做搜索引擎优化的时候,首先考虑的肯定是百度,这个是毋庸置疑的,毕竟百度占领者差不多七成的搜索市场份额.第二考虑的是360搜索,这个也是毋庸置疑的,因为360搜索占领者差不多两成的搜索市场份额.第三考虑的是搜狗搜索,这个依然是毋庸置疑的,因为搜狗搜索尤其是和搜搜合二为一的搜狗搜索大致拥有1成的搜索市场份额.这样来说,本文还写什么谷歌的搜索优化文章呢? 其实是这样的:首先,谷歌拥有一部分市场份额,虽然小,但是由于中国网民的体量大,每天用谷歌的人肯定也不在少数,这也就是说,在谷歌上优化好,依

腾讯微博正式全面屏蔽百度蜘蛛

现在,电视上和网络上都在热议一个人:邬敬民.前几天还在百度搜索他的名字,出现第一名的是邬敬民的腾讯微博.但是今天早上想再找点关于他的资料的时候,在百度搜索邬敬民.邬敬民腾讯微博等关键词都没有找到他的微博,于是我看了一下腾讯微博的robots,大家也可以去看看,打开http://t.qq.com/robots.txt,看到显示的内容如下图:   这说明,腾讯微博已经正式全面屏蔽百度蜘蛛,但也仅是百度蜘蛛,对谷歌以及除百度外的其他搜索引擎,这就让人深思了. 我在今年2月份的时候在A5发表过一篇<微博

如何做一个“百度蜘蛛妈妈”合格的孩子!

上周写了6篇文章,都在12小时内被百度蜘蛛抓取并收录,有的最快时间是2个小时左右就被收录了.因此老龙得出一条结论:www.promotecn.com在百度的权重已经提高.只要还有连续的原创文章出来,应该还是会很快被百度蜘蛛收录的.现在的百度蜘蛛就已经守在网站的"家门口"了. 如何成为一个"百度蜘蛛妈妈"合格的孩子?这里存在相当的技巧,谁不希望自己网站添加的内容马上就被百度蜘蛛收录?谁不希望百度蜘蛛妈妈就守在你家网站的门口? 百度蜘蛛最初是极其怠懒的,它会打太极拳,它

浅谈三个因素决定百度对网站内容的收录

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 如果你的网站被百度收录,意味着搜索引擎承认了网站的努力.站长的期待就是自己的网站能够在搜索引擎中可以排到前几位,百度没有收录你的网站,证明了你的网站还是有很多的问题存在.我们都希望网站可以被百度收录,从而增加网站的曝光率以及提升网站权重与排名.那么怎么样的网站内容才可以让百度尽快的收录呢?就本人的经验谈谈这个方面的原因,主要有以下三点: 第一

seo优化:百度和谷歌收录的新站优化过程

近期帮朋友做了个小站,4个简单静态页面的企业网站,两个关键词排名任务,我把优化过程写下来,与大家分享下,我不会技术(简单的HTML看的懂),SEO方面也是菜鸟,如果你觉得我说的不对,希望回复指点,谢谢. 我要优化的是"火锅技术加盟"和"火锅技术转让"这两个关键词,所以注册了一个很不错的域名,www.huoguojishu.com,域名包含了前4个字,所以优化起来比没有包含关键词的域名比较有优势.空间我帮朋友买的虚拟全能空间,56元100M,速度什么的还挺好.4号早上

5小时就被百度和谷歌收录的新站优化过程

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 很久没写文章了,呵呵,一直埋头在搞网站,近期帮朋友做了个小站,4个简单静态页面的企业网站,两个关键词排名任务,我把优化过程写下来,与大家分享下,我不会技术(简单的HTML看的懂),SEO方面也是菜鸟,如果你觉得我说的不对,希望回复指点,谢谢. 我要优化的是"火锅技术加盟"和"火锅技术转让"这两个关键词,

网站要想给百度或是谷歌收录我们要怎样操作呢

摘要: 对于网站收录的重要性,相信大家都应该知道,很多长尾关键词的排名都是来自于文章内容,文章标题,所以提高网站收录页面数量是作为网站排名的重要依据,做网站优化排名站长只 对于网站收录的重要性,相信大家都应该知道,很多长尾关键词的排名都是来自于文章内容,文章标题,所以提高网站收录页面数量是作为网站排名的重要依据,做网站优化排名站长只有解决了网站收录这个难题才能拿下网站关键词的排名大关.在前段时间,百度把一些网站的收录K的只有几十个页面,甚至有些严重的是只有首页,在那次的百度收录不正常中,很多收录