详谈百度收录过程

  关于百度收录问题,网上有很多的相关介绍,说得百度是天花乱坠,有说百度好的,也有抱怨百度的,甚至有的还大骂出口。呵呵,我个人认为百度是中国">个人站长的心脏,站长的喜悦悲哀都由这个心脏来决定。难道不是吗?

  今天跟大家讨论一下百度的收录问题,主要的讨论话题是“百度收录过程”。这个话题可以算是比较敏感的话题了,都是一些SEO专业人士的主题曲。我今天讨论这两个话题并非代表我就是SEO专业人士或者什么高手之类的,只是借凭着自己两年多来的建站经验作个自我观点介绍罢了。

  百度收录过程

  对于一个新站来说,从网站上线和提交到百度后到什么时候收录,是每个站长日日夜夜关注的问题。特别是新站长,当网站正式提交到百度后,每一天至少两次查询百度对自己的新站收录情况,甚至连做梦都想着百度。但是这样的期盼往往让很多新站长失落,因为普遍的所谓真正收录实在是太漫长了。三天不收录我可以等到第六天,第六天还不收录我可以等多一个第六天。然而二六等于十二再加三就是十五,足足的半个月时间还没收录!呵呵,这个时候难道你不感到失落吗?

  当你等到第十五天的时候我可以很明确的告诉你,其实你的网站早就被百度收录了,也许是在你提交的第二天或者第三天就被百度收录了。呵呵,这话听起来是不是感觉有点假?别说听起来有点假,看起来都有点假。既然说早就收录了,那为什么我在百度搜索里连影子都看不到呢?

  这个就是百度的独特之处,也是百度为什么能在谷歌与雅虎的强烈竞争中稳坐老大之席的因素之一。谷歌的收录原则是来者不拒,只要能找到的,短时间内就能在谷歌的搜索引擎中出现。

  而百度则是先大量的对你网站进行索引,这个索引工具俗称“百度蜘蛛”,在IIS日志中名称为“BaiduSpider”。比如:2008-07-15 00:13:54 W3SVC818374 222.214.218.36 GET /index.html- 80 - 221.10.254.26 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0 265。当你把网址如:www.bbxyx.com提交到百度后,“百度蜘蛛”就会在网络低潮时刻来访你的站点,大概是一天索引50条信息左右。IIS日志中可以查看到“BaiduSpider”的访问痕迹,其中主要的有cs-uri-stem(URI资源)、cs(User-Agent)、sc-status(协议状态)。cs-uri-stem(URI资源)记录被访问的文件名称及路径。cs(User-Agent)对应一栏中则可以看到来访者相关信息,如果是“百度蜘蛛”则显示有“BaiduSpider”字样。sc-status(协议状态)记录着的数据主要有三个:200(成功访问)、304(已索引或未更新)、404(访问失败)。当你的网站的某条数据有被“百度蜘蛛”访问过,并且sc-status(协议状态)显示的数字为200(成功访问),那么你的这条信息就已经成功的被收录了。如果sc-status(协议状态)显示的数字为304(已索引或未更新),就表示这条数据已经存在了。如果是404(访问失败)就说明蜘蛛无法成功访问这条信息,这样你就应该检查一下路径了。

  好,现在我简单的给大家说一下百度的收录程序:蜘蛛来访索引——蜘蛛携带已访问到的数据返回——百度服务器判断数据并且返回信息——数据入库。

时间: 2024-10-31 12:53:12

详谈百度收录过程的相关文章

谈百度收录过程中的快照更新

http://www.aliyun.com/zixun/aggregation/8464.html">百度收录减少的问题,好多站长都遇见过,很多朋友说自己网站莫名其妙的百度收录减少,有的在还没有找到原因,没有合适的解决办法. 百度收录减少也被有的345.wdwd.com朋友称呼为"百度拔毛"或者"百度割肉"如果是新站,出现突然减少,其实也没什么可担心的,因为baidu和google不一样.google虽然限制宽松,但是稳定,对页面有一定的要求,更新内

分析案例:百度收录网站经典过程

最近百度收录网站更加严格了,不仅新站要很长时间才收录,很多老站也被K,情况好一点的是K掉大部分页面后,只更新收页,而不再收录其他页面.百度收录法则?很多兄弟的百度收录不好,是什么原因呢.自己事例站分析.有以下几个经验: 1.名关键词过滤.凡有百度禁词,拼音相关的域名,百度原则上是不收.给想在域名上想头绪的兄弟一个沉重的打击. 第二:经常变化主题的站.在百度收录前.大量的变化主题.或者是对自己优化的信心不足.也可能,今天看流量大,就想动一下主题.明天看优化不好.再换一下的朋友. 2.每个星期四,星

新站上线两小时即被百度收录两天内百度权重1

大家好,今天我要分享的是我的新站如何快速的被百度收录的,当然老鸟不必鸟我,因为我没什么经验,做站也只是业余爱好,不过我今天还是要分享下我的经验,希望能帮到更多的新手站长. 1:新站上线前必须做好充分的准备,说道新站上线前的准备,第一就是找个好的域名,域名要和要做的网站有一定的关联性,更要好记,拿我做的网站来说吧,我做的事故事网,和故事相关的好的域名差不多都被注册了,我经过两天的精心挑选,选择了gushiduo.com 故事多 读起来顺口,也好记,就是故事多的全拼,域名选好了,当然就剩下空间了,选

浅析修改标题影响百度收录的全过程

首先说明一下此篇文章主要是帮助新手走出优化网站的误区,老鸟可以直接飞过.呵呵,通常我们在A5会看到很多文章谈到的现象或者技术方面的优化不是特别具体,概念也比较模糊,个人觉得不适合新手理解,即使有谈到修改标题对百度收录的影响也不够深入,下面我将详细的以一个实际的例子来说明新网站标题不稳定是如何影响百度收录的全过程. 很多新手站长在初期建站的时候没有详细的考虑好如何使用网站标题,往往是匆匆上线,其实这个情况是不好的,因为在后期优化的过程中当你发现标题不是很合适的时候会忍不住的修改网站标题,这个在新站

提高网站百度收录量五种实战经验分享

百度收录量在某种程度上可以提高网站的知名度,促进流量的攀升,所以,在中小型网站起步阶段,想办法提高网站百度收录量和增加百度友好度就是一项很重要的工作了.作为世界工厂食品网的市场人员,在长期的工作过程中,也慢慢的积累了一些经验,简单的总结如下,以期对大家在网站建站初期有所帮助. 一:保证网站原创和伪原创力度 我们可以想象,当百度蜘蛛爬行到我们网站的时候,发现整个网站的信息都是从别的网站上转载过来,没有一点新鲜的信息,这样的话,又怎么能吸引百度蜘蛛的再次到访和提高拜访的频率呢? 以世界工厂食品网为例

百度收录量下降减少原因分析

2012年8月31日,SEO博客收录达到203,然后从9月1日到今天,百度收录量下降减少了很多,site:首页只有80多,百度官方一直强调说site数据量不准,通过百度站长工具后台查看SEO博客有将近200的索引量.另外domain:首页,在8月31日数据量有3380,现在只有1180.下面跟随SEO博客一起来分析一下. 8月31日数据的不稳定原因是什么? 360和百度之间的攻防大战在8月31日全面升级,百度对自己的搜索结果做了屏蔽,把搜索结果URL做了加密跳转,就是防止360进行抓取,所以数据

总结关于如何提高百度收录量的一些经验

百度收录量在某种程度上可以提高网站的知名度,促进流量的攀升,所以,在中小型网站起步阶段,想办法提高网站百度收录量和增加百度友好度就是一项很重要的工作了.作为国内草根站长的一员,在长期的工作过程中,也慢慢的积累了一些经验,简单的总结如下,以期对大家在网站建站初期有所帮助. 1)你要保证空间的质量---网站能不能在百度眼里有个好权重,能不能达到快照隔天,内容当天收录,空间主机的重要性可是占了很大一部份,毕竟一个打开速度超级慢,或是很不稳定的空间是很难让百度蜘蛛喜欢的,一旦让百度蜘蛛不喜欢你的风站了,

案例分析百度收录量减少原因及对策

新站从建设到运营之后,站长们对网站考核的一个重要指标是:网站在搜索引擎中的收录量;其中搜索引擎主要是参考一家独大的百度,甚至可以这么说,百度对网站收录量的变化决定着广大站长每天的心情.若收录量上扬会让人信心百倍营利在望,可是百度收录一减少,等于在您的心头织起了一块巨大的云,愁云!这不是"云计算",是被"云算计"了. 笔者最近就遇到一家被"云算计"的网站,最突出的特点是收录量像股票一样猛跌,在作了深入分析之后,采取了一些措施,终于止跌,收录量逐渐得

什么样的文章和网站更容易被百度收录

我的网站上线也有半年的时间了,网站的收录也都是非常的正常,我在网站建设的过程中没有过任何的作弊手段,一切都遵循"百度合法和合理的原则".因此,网站的排名.网站的流量也随着时间的增长而增加,似乎一切都是在情理之内,意料之中. 不过,这几天百度对我的妈咪快孕网的收录出现较为异常的波动,让我大为紧张,以为无形中触发了什么百度的作弊机制,不过经过我的排查之后,发现问题出在每天所更新的文章之上.那么,这就涉及到我们今天的相关话题:什么样的文章和网站更容易被百度收录. 简单说一下网站: 1.空间稳