再浅谈百度抓取时出现的200 0 64现象

　　只有经历过网站关键词搜索排名跌宕起伏的站长才能真正明白，等待不是一种方式，结果需要努力和勤劳来弥补。笔者经历了网站改版到降权，关键词一无所有到关键词排名起色的过程，这个过程让人难熬和艰辛，如果有一天每一位站长都经历过这样的历程，我想百度会比现在弱小很多。

　　笔者的站在近3个月前进行一次改版，改版的目的就是为了URL标准和简单，同时也做了网站网页布局的修改，从改版后开始网站关键词一无所有，等待我的只有坚持内容更新和外链发布，直至上周网站频道关键词和长尾关键词开始进入百名，从网站改版到目前有所成就的过程中经历了很多，其中之一就是被大家蒙上恐怖主义色彩的http状态码200064，在笔者多次的实验和反复的监测中发现几下几点引发因素：

　　笔者站点GZIP压缩使用情况对比：

　　site位置：第一(使用)：site位置：第一(停止使用)

　　site快照：隔天(使用)：site位置：隔天(停止使用)

　　domain位置：16位(使用)：domain位置：10位(停止使用)

　　domain快照：差1天(使用)：domain快照：隔天(停止使用)

　　网站GZIP压缩使用过程：

　　目前各大站长都知道GZIP压缩带来的高速率的访问和良好的用户体验，但笔者认为不同的网站应视网站的情况而使用，GZIP简单的来说就是压缩减少传输给访问者数据量的一种技术，但只针对于静态页面。

　　11月12日，由于网站只有网站首页是静态页面，但首页中因为广告图片直接增加了网页的大小，为了提高首页的访问速度，因此要求程序员进行GZIP压缩处理，但就在压缩后第二天笔者发现网站IIS日志中出现大量的200064状态码，其中发现大部分是百度抓取时出现的状态码，当时并没有引起注意，并处理以标记日志正常，继续检测。

　　11月26日，笔者一直检测的网站日志仍然出现200 0 64，并由于之前网站已在被降权的过程中，因此domain网站首页保持不变，但持续了近2个月的高质量更新和外链建设到此为什么没有效果呢?笔者在互联网上找了200 0 64所有的解释说明，并最终决定停止GZIP压缩，恢复正常。

　　11月26日，停止GZIP压缩，次日百度抓取状态码回复正常，持续时间为半个月。就在11月28日早晨发现，网站domain时上升第十位。

　　在此期间笔者的网站site和domain时快照时间均为隔天，因此从以上二点我们可以判断，200064并非网上流传的所谓抓取删除的概念，而是一种抓取不完整的意思，因为压缩传输，因此造成百度抓取无法正常完整的获取网页中所有的内容信息，提醒是完整的获取。因此如果有站长发现网站日志中百度抓取出现这样的问题，而且刚好网站也使用了GZIP压缩，那么停下一段时间，再对比网站日志情况，我想抓取不完整不是百度自身的索引行为问题，但长期的抓取不完整一定会受到一定程度的处罚，笔者建议新站或是在1年以内的站点要多注意200064的情况。

　　总结：网站出现200064现象一定有原因引起，通过笔者亲身体验证明该抓取状态并非是网上流传的那么恐怖色彩，站长记录好每一次操作就可以发现这些问题的所在，不是服务器问题就是技术原因。网站就像自己的孩子，总是需要努力的付出和合理的养育，这样网站这个孩子才能茁壮成长!

　　本文出自http://www.kidsnet.cn，A5首发，转载请注明来源，并保留来源的完整性，谢谢!

时间： 2024-10-24 14:34:15

再浅谈百度抓取时出现的200 0 64现象

再浅谈百度抓取时出现的200 0 64现象的相关文章

百度蜘蛛抓取的HTTP状态“200 0 64”分析

从网站日志200 0 64状态码数据分析谈做科学的SEO

浅谈百度外链对网站关键词排名的影响

百度抓取纯文本链接 Lee说SEO外链建设规则

.Net生成站点sitemap供百度抓取的类和使用

关于百度抓取中文URL的快照问题

关于数据抓取时网页编码各不相同的问题

浅谈Python爬取网页的编码处理_python

玩玩小爬虫——抓取时的几个小细节