百度蜘蛛抓取的HTTP代码为什么相反?

  5.494.html">前段时间做了几个站,用的全是.cn玉米。到目前为止除了一个站没有被收录外,其他的站都收录了,这几天稍微抽了点时间看了下日志,发现了一个奇怪的现象。

  这个不白百度宠的站是我用dede的一个模板直接套用的,网址是:www.chlsxs.cn就只在8月10号首页被收录了,但紧接着11号就被K了,今天(11号)我检查了下首页,发现了几个死链,修改完毕了,不知道明天会不会好点。下面还是说下日志记录,为了便于说明,我发2个有代表性的日志记录

  2008-08-11 06:04:00 W3SVC1445103624 125.46.13.155 GET /index.html - 80 - 220.181.32.16 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0

  2008-08-10 00:18:04 W3SVC1445103624 125.46.13.155 GET /index.html - 80 - 61.135.168.42 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 64

  从日志可以看出,很明显的,百度个MJJ的,2台服务器抓的结果不一样。一个200 0 0,另外一个200 0 64。

  在网上查了下相关资料,200 0 64行为可以被解释为清除数据,正常的抓取是成功标志200 0 0

  现在的情况一个正常一个不正常,咋办?很多人说是关键词密度过高,但我查了下在正常范围内啊,而且我根本没有优化。。

  不知道有站长遇到过没?指导下吧。

时间: 2024-08-01 19:35:25

百度蜘蛛抓取的HTTP代码为什么相反?的相关文章

新站怎么提高百度蜘蛛抓取网站的方法

1,安装百度分享 依据seo/seo.html" target="_blank">搜索引擎的各位站长,做百度关键词排名的各位seoer们.我们都是不是都很关心百度蜘蛛?我们每天是不是都要看看网站日志,看看百度蜘蛛爬去了那些网页,看看百度蜘蛛喜欢什么样的内容,看看百度蜘蛛每天什么时候来,看看百度蜘蛛来的次数多不多. 2.到知名的网站去做推广   这里推荐A5论坛,权重高,收录快,可以用它的高权重来带引百度收录自己的网站,这样的效果是很明显的,我有一个小站,在A5等一下论坛

百度蜘蛛抓取的HTTP状态“200 0 64”分析

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 今天QQ上有位网友"银狐云枫"给我发来消息说,他的网站之前被人入侵挂了马,被百度K掉了,原来百度爬虫正常抓取页面的时候,返回的http状态是200 0 0,现在爬到他的网页总是200 0 64,他问这个64是什么意思,是不是百度清除页面,有什么解决方法. 我之前也写过一篇关于百度,google,yahoo搜索引擎的蜘蛛爬虫

百度不再抓取“description”部分时站长如何应对?

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 每天忙着做手里的单子,好久都没有写SEO优化的文章了,今天怎么也要抽点时间来谈谈这个问题,因为这个问题小则只是影响我们短时间的网站排名和流量大小,大则可能会影响我们SEO优化行业的技术变动.都说SEO行业是在不断推动搜索引擎技术更佳优良化,从现在用户从搜索引擎搜索出来结果满意度与以往比较确定有了很大的提高,虽然,不能说这种效果是我们SEOER

总结几点现在百度更新蜘蛛抓取的几点规律

摘要: 今天起床后我打开网站发现了一个现象,那就是百度蜘蛛在一个晚上来了几次,我的网站的更新频率是白天一篇文章,晚上11点到12点更新3篇文章,经过对网站的检查与分析,然后我与 今天起床后我打开网站发现了一个现象,那就是百度蜘蛛在一个晚上来了几次,我的网站的更新频率是白天一篇文章,晚上11点到12点更新3篇文章,经过对网站的检查与分析,然后我与朋友在QQ中聊了一下他手中的几个网站,我总结出了几点现在百度更新蜘蛛抓取的几点规律. 1.百度蜘蛛在7月13日的大更新之后越来越注重原创内容,前两次的大更

php记录搜索引擎蜘蛛抓取页面代码

php教程记录搜索引擎教程蜘蛛抓取页面代码 error_reporting(E_ALL & ~E_NOTICE); $tlc_thispage = addslashes($_SERVER['HTTP_REFERER'].$_SERVER['PHP_SELF']);/*($_SERVER ['HTTP_HOST'].$_SERVER['PHP_SELF']);($_SERVER['HTTP_USER_AGENT']);*/ //添加蜘蛛的抓取记录 $searchbot = get_naps教程_b

蜘蛛抓取的行为

摘要: 通过对网站日志的分析,我们可以很好的判断我们的网站的健康程度,并且还可以看到蜘蛛抓取的记录以及用户的一些行为记录,这样数据对于我们来讲无疑是 提升网站的一个关键,可 通过对网站日志的分析,我们可以很好的判断我们的网站的健康程度,并且还可以看到蜘蛛抓取的记录以及用户的一些行为记录,这样数据对于我们来讲无疑是 提升网站的一个关键,可以时刻的让我们看到网站的不足之处,从而进行改正.然而今天小编与大家分享的主要是蜘蛛抓取的行为,希望对各位站长有所帮助. (一)蜘蛛访问的次数.停留时间以及抓取的数

蜘蛛抓取网页过程的四步曲

随着搜索引擎的不断发展与升级,搜索引擎所派出的蜘蛛也变得越来越智能了,所以为了要弄清楚蜘蛛的工作原理,为了更好的优化自己的网站我们就必须不断的去研究蜘蛛.下面,我就和大家简单的聊聊蜘蛛的基本工作原理吧: 蜘蛛工作的第一步:爬行你网站的网页,寻找合适的资源. 蜘蛛它有一个特性,那就是他的运动轨迹通常都是围绕着蜘蛛丝而走的,而我们之所以将搜索引擎的机器人命名为蜘蛛其实就是因为这个特性.当蜘蛛来到你的网站之后,它就会顺着你网站中的链接(蜘蛛丝)不断的进行爬行,因此如何让蜘蛛能够更好的在你的网站中进行爬

分享如何通过robot灵活控制蜘蛛抓取

做SEO没有人不知道蜘蛛吧,robot.txt文件就是和蜘蛛交流的文件,很多人都会说介绍要怎么让蜘蛛来爬行,却很少人知道用robot.txt去操控蜘蛛,robot.txt用得好的话蜘蛛可以为你所用.下面我来介绍一下如何操控蜘蛛. 一. 屏蔽相同页面 搜索引擎是个喜新厌旧的东西,不会去收录重复的也或者已有的页面,即使收录了后期也会被删掉,所以一开始我们可以打开robots文件,写入禁止蜘蛛来读取这个页面的代码,给蜘蛛来下个好印象,反之印象分会大大减分,影响将来蜘蛛来爬行网站. 二.维护网站安全 利

详解python3百度指数抓取实例_python

百度指数抓取,再用图像识别得到指数 前言: 土福曾说,百度指数很难抓,在淘宝上面是20块1个关键字: 哥那么叼的人怎么会被他吓到,于是乎花了零零碎碎加起来大约2天半搞定,在此鄙视一下土福 安装的库很多: 谷歌图像识别tesseract-ocr pip3 install pillow pip3 install pyocr selenium2.45 Chrome47.0.2526.106 m or Firebox32.0.1 chromedriver.exe 图像识别验证码请参考:http://ww