怎样分析百度蜘蛛来过自己的网站

  最近,菜菜经常没事的时候就喜欢到各大论坛,去瞧瞧,去看看。为什么?原因很简单,我去其他的论坛上回答问题做外链呀,好让百度蜘蛛通过外链爬到我的网站上抓取我的网页呀,但是这几天,菜菜发现一个问题,在网上兼职赚钱创业的朋友都应该有一个网站吧,就是很多站长,我估计哈 ,可能都是新手,基本上问的问题都是关于百度什么时候才会收录自己的网页,说道这点,大家可以去我这篇文章看下,关于新手前期做网站的心态的,对新手是有帮助的。再或者百度蜘蛛是否来过我的网站,怎么才知道百度蜘蛛来过我的网站呢?我们只需要查询网站日记,去好好的分析网站日记就可以了。

  百度蜘蛛是个摸不着性子的东西,最近听说百度在做大的调整,导致很多网站的排名情况,外链数量变动很大呀,老站长就没什么了饿,可是对于新站长来说。心里就一阵一阵的怕了。也不知道百度这次的调整要什么时候才能稳定呀。

  其实百度蜘蛛是有规律可循的,它一般都是一周一小变,一月一大变那种,对于新手来说,只要把心态调整好,是没有问题的【关于心态的文章请参考;“新人学习SEO的心态变化】,下面就具体讲讲百度蜘蛛的小细节了,知道了这些就知道了 百度蜘蛛到你网站上具体来做什么。

  百度蜘蛛大概分为三类:

  我们最常见的就是:220.181.108.*这一段了!这段IP注意负责抓取网站的更新,和增加网站的权重的作用。

  其次就是:123.125.71*。这段IP注意负责一些权重比较低的网站文章抓取情况,和文章原创度的情况,一般会在48小时内抓取你的网页,但是也会在48小时内删除你的资料。这也是许多新手站长奇怪的是为什么我的网站收录不到很久就没有排名的原因。一定要请大家注意,这个IP出现在网站日记的话一定要小心!

  最后一个,也是大家不愿意看到的一个IP:123.125.68*。这段IP我们一般叫做黑武士,他如果来到你的网站的话,你的网站基本就会被降权或者被K掉,情况好的只会抓取你一次,如果网站大量出现这样的百度蜘蛛的话,你的网站就准备被K掉吧,也说明了百度发现你做了很多不好的事情。这个IP事许多老站长都不愿意看到的IP。

  百度蜘蛛的三大类的基本工作情况:

  前面我们说道最常见的就是220.181.108.*。内容已经解释过了就不在解释了,主要的蜘蛛【220.181.108.86】它抓取的网页权重是最大的,如果说这个蜘蛛在你的网页上返回正常的话,说明你的网站问题不大,如何抓取的时候返回数据库有其他的数值的话,说明网站问题就很大了,一定要注意。

  快照蜘蛛:顾名思义就是说专门给你网页拍照的蜘蛛。IP结尾的75的就是快照蜘蛛,它来到你网站越多越好,为什么?不解释了。

  IP结尾的89的蜘蛛,我们称为高权重的蜘蛛,但是它的权重没有IP86结尾的高,但是权重也是非常不错的。

  接下来就是:94,97,80,83,z这些蜘蛛都是高权重的蜘蛛,它们的权重是依此递减的。剩下来的就是普通的蜘蛛了,它们会抓取新的网站的内容,返回数据库的值有200的话,一般情况下,会在24到40小时至内会被放出的。如果现实304的话,就说明此网站有待考察。

  123.125.71*

  这段IP有两个功能!

  一,检查更新情况,一般这种情况的蜘蛛权重都比较低,它们一般只会检查网站的首页的更新情况。

  二,文章的原创度的多少,此原理来自半发现象,怎么说呢,一般情况下被一个低权重的百度蜘蛛抓取过的网页的,它会再在抓取网页,如果发现相同的地方,会在48小时内删除的,并且还会降权的。

  很多朋友都真正地很少的知道百度蜘蛛的工作原理是怎么回事的,通过菜菜的这篇文章,相信大家会对百度蜘蛛有个全新的认识,并不是说百度蜘蛛到你的网站上就是好事,这一定要注意!!!!

时间: 2024-09-21 01:31:02

怎样分析百度蜘蛛来过自己的网站的相关文章

如何打造最适宜百度蜘蛛居住游玩的优质网站

我不打算用生硬的语言来描述什么是SEO,怎么来做SEO.那么我们不妨换一种更加形象的方式来理解如何才能让百度爱上你的网站.不知道有多少站长感受到做网站也是一个伟大的工程,站长更是一个神圣的职业呢?我希望通过此文鼓舞每一位草根站长重拾信心! 很多时候站长都有沮丧过,也有痛苦过.而大部分原因都是因为流量.而对于小网站更加视百度为"上帝",渴望能得到上帝每天赐予流量. 于是百度排出了他的使者--蜘蛛,来到了站长们的网站,按照自己的规则给网站排名并给予流量.那么站长们如何款待蜘蛛,得到使者的青

如何让百度蜘蛛每天抓取你网站的内容

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 百度最近的算法让挺多seoer头痛的,因为很多网站出现百度不收录,快照不更新的现象.笔者也是比较郁闷的,这段时间看了很多这方面的书籍和测试,发现百度的很多算法做了调整,可能大部分是针对那些优化过度,采集过度的网站.那么,如何保持让百度每天及时收录你的文章呢?笔者有一点体会给大家参考. 1. 友情链接一定要做好,无论花多少时间.如果你在做百度的

分析百度为何不收录你的网站产品页

很多做搜索引擎优化的新手朋友优化企业站可能都遇到过百度不收录,要么是没内容 要么是相同内容.这个在B2C中更为突出!什么品牌介绍啊 售后啥,常见问题类的的内容一堆. 之前也多次提到产品页收录对于网站搜索引擎优化的好处:数据收录量增加 ,网站更新快照,获得长尾关键词流量,如产品型号.之前写了个<详解:B2C商城产品页面搜索引擎优化> 这里在补充一些,二个文章加起来 ,所以的问题应该能搞定了. 1.每个页面的标题尽量避免重复(可以稍加修饰语). 比如这个"阿玛尼 AR4228 男士机械表

百度蜘蛛机器人爬行量与收录量的关系

大家一定都知道,百度蜘蛛机器人来爬行你网站的数量,远远大于收录量,那么它们之间到底有什么联系,今天我们就来谈谈. 一.初试期 我在这点说的初试期,指的是网站开通到给百度收录提交过后的一个星期,在这一个星期内,百度蜘蛛机人的活动方式是这样的,首先百度机器人会来爬行的提交网站的首页,然后过一会,在根据它分析的结果,有可能是一天或几分钟过后就在次来爬行,你首页上的其它页面.当然在这个阶段,机器人爬行首页次数会非常少,有可能一天只有几次爬行首页,主要是因为你网站上有很多链接,它得一个一个的爬.机器人的爬

注意四个事项 让百度蜘蛛更加青睐你的站内文章

一个站长最大的梦想莫过于自己的网站文章每篇都被百度蜘蛛给抓取.收录,但是随着百度算法不断改革,站长们越来越头疼自己网站的收录问题了,很多时候即使每天踏踏实实规律更新,都很难再度增加网站的收录比例,这其中的问题究竟在于哪里? 百度对站内文章都会有它特定的评价标准,笔者也从中和一些优化老手研究探讨过,什么样的文章才是百度想要的.通过实践和验证,笔者也简单地总结了一套规律,想要达到秒收就要注意四个文章写作事项,那究竟是哪四个注意事项呢?下面笔者就来和大家探讨一下. [注意事项一]:文章主题不能脱离网站

如何增加百度蜘蛛对你网站的好感度

不可否认的是百度已经成为了我们站长日常做站中不可缺少的一分子,因为网站想要有访客流量,我们站长就要需要它,网站想要赚到钱,我们站长一样也是离不开它,因此百度的一举一动一直都会揪着我们的站长心,生怕哪天它会抛弃了我们的网站,所以,为了避免这种情况的发生,我们站长只能努力的讨好它,那要怎么做才能增加百度蜘蛛对我们网站的好感度呢? 1)保证空间主机的稳定运行,尽量不要让空间出现什么问题! 站长想让百度蜘蛛爱上你的网站,首先要保证的就是空间的质量,毕竟一个经常出问题的网站是很难会让百度蜘蛛的,所以,为了

如何做一个“百度蜘蛛妈妈”合格的孩子!

上周写了6篇文章,都在12小时内被百度蜘蛛抓取并收录,有的最快时间是2个小时左右就被收录了.因此老龙得出一条结论:www.promotecn.com在百度的权重已经提高.只要还有连续的原创文章出来,应该还是会很快被百度蜘蛛收录的.现在的百度蜘蛛就已经守在网站的"家门口"了. 如何成为一个"百度蜘蛛妈妈"合格的孩子?这里存在相当的技巧,谁不希望自己网站添加的内容马上就被百度蜘蛛收录?谁不希望百度蜘蛛妈妈就守在你家网站的门口? 百度蜘蛛最初是极其怠懒的,它会打太极拳,它

分析网站日志中百度蜘蛛返回304状态码的情况

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 最近遇到一个网站被百度蜘蛛抓取首页后大量返回304状态码的问题,以前遇到过301和302,就是没了解过304,刚好可以对这个情况进行一下分析和观察,以便比较深入的了解该问题的出现以及应对之策. 百度百科对304状态码是这么解释的:如果客户端发送了一个带条件的 GET 请求且该请求已被允许,而文档的内容(自上次访问以来或者根据请求的条件)并没有

百度蜘蛛抓取的HTTP状态“200 0 64”分析

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 今天QQ上有位网友"银狐云枫"给我发来消息说,他的网站之前被人入侵挂了马,被百度K掉了,原来百度爬虫正常抓取页面的时候,返回的http状态是200 0 0,现在爬到他的网页总是200 0 64,他问这个64是什么意思,是不是百度清除页面,有什么解决方法. 我之前也写过一篇关于百度,google,yahoo搜索引擎的蜘蛛爬虫