百度spider不支持Crawl-delay设置对优化的影响

  今天中午百度站长社区平台更新了一条公告,如下:

  尊敬的各位用户,亲爱的站长们,大家好:

  近期,我们收到一些对Crawl-delay用法的询问,现明确百度对网站访问频率不再参考该设置,即不支持Crawl-delay配置,如果您希望配置网站针对百度spider的访问频率,建议您使用百度站长平台的抓取压力反馈工具,先查询网站在百度近一个月的天级抓取量趋势图,可调节百度spider每天访问您网站的抓取压力上限,供百度参考,避免百度spider对站点抓取压力过大,造成网站服务器负载及抓取异常。

  相信很多人都不清楚什么是Crawl-delay,笔者也是才知道有这个东西,通过搜索,笔者了解到Crawl-delay翻译成中文意思是抓取延迟的意思。那么Crawl-delay到底干什么用的呢?用在什么地方呢?笔者在一番查询之后整理出来,与大家分享:

  要谈到Crawl-delay的用途,还需要提及大家都比较熟悉的Robots协议,网站通过robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。而通过Crawl-delay我们可以设置一个让蜘蛛有较低的抓取请求频率,这样就可以降低了服务器的压力,而设置Cralw-delay的大小应该根据服务器能够承受的压力和机器人的数量来确定。例如你希望yahoo的机器人每2秒来一次,就应该先查看访问服务器的yahoo的机 器人有多少个,假如有40个yahoo机器人,这个参数就应该设置为2*40=80。但如果40多个爬虫恰好都在同一个时间段内采集,即便每只间隔100秒,40只先后脚的来爬,到最后一只 爬完后,第一只的间隔时间又到了,造成的压力很大了,不过这可能是最“理想”状态下才会发生的。

  接下来展示一个 Crawl-delay的应用实例:

  

  大家可以看到Crawl-delay 后面的数值100表示告诉蜘蛛程序,以秒为单位的最低延时。如果crawler频率对您的服务器是一个负担,您可以将这个延时设定为任何您认为恰当的数字,每间隔100s来爬行一次。这个设置似乎只针对于大站,小站很少见,设置Crawl-delay注要原因是蜘蛛程序爬的过快,会给服务器照成负担,影响正常的网站展示速度。

  百度此次特地发出声明说不支持Crawl-delay设置,并不代表从此Crawl-delay设置无用武之地。目前支持这个参数的搜索引擎有Slurp(yahoo和altaVista的机器人)、MSN使用的微软机器人,Googlebot还没有使用“Crawl-delay”参数,现在百度也没有,那么我们可以反过来想,如果我们主要是以百度搜索为主要推广手段以其他搜索引擎为辅助的话,我们可以在服务器条件不好的情况下,通过设置Crawl-delay降低其他搜索引擎的抓取频率,这样就可以合理的减少服务器压力,从影响优化因素的角度来讲也是一个好消息!

  所以,不管百度怎么变,宗旨是不会变的,我们在围绕百度做优化的同时,合理的采取一些小技巧,也许会收到意想不到的收获!

  文章编辑由南昌胃肠检查http://www.86818330.com/独家编撰,转载请勿删除源地址!

时间: 2024-12-16 23:22:01

百度spider不支持Crawl-delay设置对优化的影响的相关文章

麻木的百度spider 1年无法识别301

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 站长论坛上有站长抱怨,自己网站做301跳转一个月以后,百度仍然没有正确处理自己网站的301跳转.在百度知道上日前也有网友发问,自己的网站做了首选域设置,将不带WWW的域名解除绑定301重定向到网站首选域域名上,但设置一段时间之后,令他感到郁闷的事情终于出现了--这位朋友发现,被设置为首选域的网站域名百度不收录,快照不重新,而不带WWW的非首选

百度统计已支持百度转码流量

来自百度官方消息,百度统计已经支持百度转码流量.原来大部分pc网页在中低端手机中都无法流量,用户通过百度搜索的网页都会被百度转码成wap格式,并标注:原网页已由百度转码以便在移动设备上查看. 因为百度转码的网页基本不加载js代码,导致该转码流量无法被记录,百度统计升级,当一个PC页面,经过百度转码时,虽不加载js代码,但会自动识别百度统计代码,并将数据以图片请求形式发送给百度统计服务器(原理类似wap统计),从而保证了这部分流量被记录,且站长朋友无需做任何设置. 这是个好消息,坏消息是只支持百度

百度竞价哪些IP地址需要设置IP排除

大家都知道,百度竞价后台有一个功能叫"IP排除",这个功能主要是用于排除一些无意义或恶意的IP.这是因为在我们日常投放中,无意义.恶意的IP普遍存在,如果不排除,会浪费我们大量的投放费用,影响投放的效果.鉴于此,96SEM就和大家谈一下百度竞价哪些IP地址需要设置IP排除. IP排除一:企业公司自身IP 企业公司内部就有很多相关的人员需要利用到自身的网站,或多或少会有人搜索进入自身的网站,那么这时候就往往会存在误点,特别是一些大企业.大公司,员工几千乃至上万的,往往很多人不知道竞价推广

从百度spider工作原理看如何提升优化效果

在圈子里有一句笑话是说站长每天早上起床第一件事是什么?答案是查百度收录.看快照时间.看排名!虽然有些夸张,却也非常形象地说明了站长对网站在百度搜索中优化情况的重视程度.在这些要素之中,网站快照.排名.收录数量共同构成了一个网站的优化效果,反映出网站在搜索引擎之中占据的"分量"也就是我们常说的"权重"如何.权重越高,越容易带来更好的优化效果.提升网站优化效果能够获得更多的搜索流量,也就意味着更多的用户和潜在的收益来源!下面我们就从百度spider(百度蜘蛛)的工作原理

百度输入法苍老师皮肤怎么设置?

  百度输入法苍老师皮肤上线啦,你只需要下载百度输入法,或者将你手机中的百度输入法更新到最新版,就能够安装苍老师皮肤啦!在打字的过程中还能够听听苍井空的声音哦!百度输入法苍老师皮肤怎么设置?看看百度输入法苍井空皮肤设置教程! 首先,打开百度输入法,选择苍老师皮肤. 点开后,"启用". 皮肤就能够启用成功了. 你就能够愉快地打字啦!  

安卓百度地图导航的模式怎么设置?夜间模式还有白天模式 求代码

问题描述 安卓百度地图导航的模式怎么设置?夜间模式还有白天模式 求代码 安卓百度地图导航的模式怎么设置?夜间模式还有白天模式 求代码? 解决方案 UiModeManager设置夜间模式和行车模式

百度加速乐支持比特币支付

摘要: 百度加速乐支持比特币支付 10月15日下午消息, 百度 加速乐( jiasule.baidu.com )页面显示,这一网站安全加速平台目前已支持采用比特币进行支付,但需要用户另行与 客服联系. 百度加速 百度加速乐支持比特币支付 10月15日下午消息, 百度 加速乐( jiasule.baidu.com )页面显示,这一网站安全加速平台目前已支持采用比特币进行支付,但需要用户另行与客服联系. 百度加速乐是由百度和北京知道创宇信息技术有限公司联合推出的一站式网站安全加速平台,官方介绍称目前

百度算法更新后对搜索优化的影响分析

今年百度算法的更新速度和深度可以说是颠覆性的,从今年年中就陆续推出了原创星火计划.石榴算法和绿萝算法,从这些算法的名字来看,就显得出智能环保的概念,其目的就是为了肃清互联网上的垃圾,优化互联网的环境,让广大用户能够在互联网上冲浪的非常舒心. 当然百度的算法频繁的更新也和其自身遭遇的一些竞争不无关系,如果百度不能够高效的提供有用的信息给用户,那对用户的吸引力就会下降,从这点上来看,也是由于竞争的激烈倒逼百度进行算法上的创新.这些更新后的算法对广大SEO优化人员会产生什么样的影响呢?笔者认为可以从垃

从百度搜索结果网址的变化看未来优化之路

在经历一轮大的百度K站风波之后,百度近期并无大的动静,这让我们站长们稍稍松了一口气,但细心的站长仍可以发现百度还是有点小变化的.平时搜索一些关键词,在得到的结果中,研究对手的网站时,我比较喜欢直接在百度的搜索结果复制它的链接地址,然而,最近我发现这个方法行不通了,直接复制链接地址得到的是一堆字母加数字,并不是百度搜索结果的网站真实地址,这让我很好奇,不得不仔细研究了一下这样的变化背后到底隐藏着什么,对我们未来的优化之路有哪些提示呢? 以下结果均是笔者个人观点,特地分享出来给大家,希望大家一起关注