百度蜘蛛抓取的HTTP状态“200 0 64”分析

  

  今天QQ上有位网友“银狐云枫”给我发来消息说,他的网站之前被人入侵挂了马,被百度K掉了,原来百度爬虫正常抓取页面的时候,返回的http状态是200 0 0,现在爬到他的网页总是200 0 64,他问这个64是什么意思,是不是百度清除页面,有什么解决方法。

  我之前也写过一篇关于百度,google,yahoo搜索引擎的蜘蛛爬虫的文章,谈到了三大搜索引擎抓取网站页面的特点。但是没有针对返回的http状态诸如200 0 64进行分析说明。

  这是IIS里的相关解释:net helpmsg 64--The specified network name is no longer available. 意思是指定的网络名不可用,或许是路径错误,或许是文件已经不存在,但这仅仅是IIS自身的http状态说明。而在百度爬虫日志里返回200 0 64,而众所周知,百度是有人工干预的,这64说明了什么?

  在百度研究院的论坛里看到一位版主有这样的一段解释:

  蜘蛛在IIS里的行为200 0 64 的解释

  根据我前段时间到现在的观察,虽然没有足够的证据,但是基本上可以肯定在IIS中,如果蜘蛛后面的号码出现200 0 64

  那么网站中的这个单页面就会在搜索引擎中消失了.我被K的页面后面都写着200 0 64 ,不知道大家是否认同,还有其他看法,当然,我说这个不够绝对,因为我也有一个页面后面显示着200 0 64 但是在搜索引擎中依旧可以找到.这也说明着问题,但大多200 0 64行为的网页就已经没有了.

  所以我觉得蜘蛛的200 0 64行为可以被解释为清除数据。

  这个解释,目前看上去还是有可信度的。flymorn认为,抓取状态成200 0 64是不正常的抓取,正常的抓取是成功标志200 0 0,当变成了200 0 64的状态时说明搜索引擎在抓取这个页面的时候出现了错误,没有正常的进行常规抓取;对于百度来说,百度很可能是已经不再把这些页面抓进主索引库,而是放进了“百度沙盒”里进行考察,考察多久,就看你如何改进,也许,你看不到百度把这些被K的网站释放出来的时候,人是没有规律的。

  正好,flymorn也有被百度K的网站,打开这个网站的IIS日志(.log后缀,如ex080222.log),果不其然,也发现了百度返回200 0 64的状态:

  2008-02-22 07:14:37 W3SVC78302822 58.17.36.91 GET /article/1/79.html - 80 - 61.135.163.102 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 64

  2008-02-22 07:18:07 W3SVC78302822 58.17.36.91 GET /article/1/11.html - 80 - 61.135.163.102 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 64

  对于已经被百度拔毛的网站来说,如果你还在乎百度,那就赶紧改正网站上的一切作弊的地方,消除过度优化,消除恶意链接,等待百度再次光临,一般来说,这需要2-3个月的时间,还是认真做站,先想着用户为好。(本文原创,作者:Flymorn)

时间: 2024-08-03 01:47:48

百度蜘蛛抓取的HTTP状态“200 0 64”分析的相关文章

再浅谈百度抓取时出现的200 0 64现象

只有经历过网站关键词搜索排名跌宕起伏的站长才能真正明白,等待不是一种方式,结果需要努力和勤劳来弥补.笔者经历了网站改版到降权,关键词一无所有到关键词排名起色的过程,这个过程让人难熬和艰辛,如果有一天每一位站长都经历过这样的历程,我想百度会比现在弱小很多. 笔者的站在近3个月前进行一次改版,改版的目的就是为了URL标准和简单,同时也做了网站网页布局的修改,从改版后开始网站关键词一无所有,等待我的只有坚持内容更新和外链发布,直至上周网站频道关键词和长尾关键词开始进入百名,从网站改版到目前有所成就的过

百度蜘蛛抓取的HTTP代码为什么相反?

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 5.494.html">前段时间做了几个站,用的全是.cn玉米.到目前为止除了一个站没有被收录外,其他的站都收录了,这几天稍微抽了点时间看了下日志,发现了一个奇怪的现象. 这个不白百度宠的站是我用dede的一个模板直接套用的,网址是:www.chlsxs.cn就只在8月10号首页被收录了,但紧接着11号就被K了,今天(11号)

新站怎么提高百度蜘蛛抓取网站的方法

1,安装百度分享 依据seo/seo.html" target="_blank">搜索引擎的各位站长,做百度关键词排名的各位seoer们.我们都是不是都很关心百度蜘蛛?我们每天是不是都要看看网站日志,看看百度蜘蛛爬去了那些网页,看看百度蜘蛛喜欢什么样的内容,看看百度蜘蛛每天什么时候来,看看百度蜘蛛来的次数多不多. 2.到知名的网站去做推广   这里推荐A5论坛,权重高,收录快,可以用它的高权重来带引百度收录自己的网站,这样的效果是很明显的,我有一个小站,在A5等一下论坛

个人建站经验分析百度200 0 64状态

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 现在在百度知道或是站长论坛中经常能看到很多人经常在问百度蜘蛛来网站后经常留下200 0 64状态,问是不是进入人工审核了,今天我就以我多个网站的经验来给大家解释一下. 其实对于不同的搜索引擎,它们的蜘蛛爬行自己的网站后都会留下一些状态,我管它叫蛛丝马迹,那么这些蛛丝马迹中最被大家关注或是说关系的就莫过于200 0 64这个状态了. 对于大家而

蜘蛛抓取的行为

摘要: 通过对网站日志的分析,我们可以很好的判断我们的网站的健康程度,并且还可以看到蜘蛛抓取的记录以及用户的一些行为记录,这样数据对于我们来讲无疑是 提升网站的一个关键,可 通过对网站日志的分析,我们可以很好的判断我们的网站的健康程度,并且还可以看到蜘蛛抓取的记录以及用户的一些行为记录,这样数据对于我们来讲无疑是 提升网站的一个关键,可以时刻的让我们看到网站的不足之处,从而进行改正.然而今天小编与大家分享的主要是蜘蛛抓取的行为,希望对各位站长有所帮助. (一)蜘蛛访问的次数.停留时间以及抓取的数

百度不再抓取“description”部分时站长如何应对?

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 每天忙着做手里的单子,好久都没有写SEO优化的文章了,今天怎么也要抽点时间来谈谈这个问题,因为这个问题小则只是影响我们短时间的网站排名和流量大小,大则可能会影响我们SEO优化行业的技术变动.都说SEO行业是在不断推动搜索引擎技术更佳优良化,从现在用户从搜索引擎搜索出来结果满意度与以往比较确定有了很大的提高,虽然,不能说这种效果是我们SEOER

从网站日志200 0 64状态码数据分析谈做科学的SEO

记得去年笔者刚入门SEO时,在SeoWhy悬赏了一个关于网站IIS日志的问题,大概描述是:百度蜘蛛抓取网站,日志为什么会出现200 0 64代码?64表示什么? 得到了蛮多人热心回复,大致有以下七种说法: 1.64表示64位系统; 2.64表示抓取次数; 3.64表示正常,不需要理会; 4.64表示网页没有更新; 5.64表示k站的前兆; 6.64表示网站处于考核期; 7.64表示蜘蛛对网站Gzip压缩解密失败; 由于当初福清seo经验不够,也没有对网站日志进行详细分析,故此事不了了之.但通过自

服务器日志中200 0 64如何改变为200 0 0

以前看过一篇关于 IIS日志中 有关200 0 64的文章,原文的地址我也记不清楚了.当时自己的网站也没有出现这样的字符,所以当时也不是很关心,后来,网站被拔毛.新站一直不收录.查找了很多原因,才得出了把64变成0的方法,这个方法我不敢保证对你们适用,但是我的站点确实是这样的. 先看看64在IIS中的解释.在DOS里输入 net helpmsg 64 出现指定的网络名不再可用,但是访问的话还可以访问啊.问题究竟是出在哪里呢? 这仅仅是IIS自身的http状态说明. 以前的文章中是这样解释的: 众

总结几点现在百度更新蜘蛛抓取的几点规律

摘要: 今天起床后我打开网站发现了一个现象,那就是百度蜘蛛在一个晚上来了几次,我的网站的更新频率是白天一篇文章,晚上11点到12点更新3篇文章,经过对网站的检查与分析,然后我与 今天起床后我打开网站发现了一个现象,那就是百度蜘蛛在一个晚上来了几次,我的网站的更新频率是白天一篇文章,晚上11点到12点更新3篇文章,经过对网站的检查与分析,然后我与朋友在QQ中聊了一下他手中的几个网站,我总结出了几点现在百度更新蜘蛛抓取的几点规律. 1.百度蜘蛛在7月13日的大更新之后越来越注重原创内容,前两次的大更