关于百度的索引量、收录量、site结果与相关结果

  从搜索原理上讲,蜘蛛先抓取到一个网页的URL,然后对这个URL对应网页的内容进行下载、分析,对于符合其质量标准或有一定用途的网页进行索引,把索引后的网页放入索引数据库中。这时候索引库内的网页有些具有用户检索价值的,有些是具有搜索引擎自身的检索价值的,对于对用户有检索价值的被索引的网页,会进行输出,也即是我们说的收录。而对仅仅有搜索引擎自身检索价值的网页可能并不输出,仅仅有一定的索引量而没有输出结果数,因此我们可以看到很多时候收录量会比索引量低很多。

  站在搜索的角度而言,一个网站的网页数量有时候是大于目前所拥有的网页数量的。举例来讲,比如一个站有100个网页,对于用户或者站长而言,是100个网页,但是这100个网页可能进行了数据更新,网页改变等多个操作,不同版本或许能满足不同的需求,(因此我们也可以看到很多时候一个网页有不同的快照。)从这个角度而言,在搜索的眼中一个网站的网页数量是可以大于网站目前所拥有的输出网页数量的,特别对于频繁修改的网站或者URL不规范的站点。同时,站在搜索引擎的数据角度而言,其数据量可能由历史数据和更新数据等组成的,因此site相关结果值也大于site结果数。

  依据上面的说法,我们把四者的关系重新梳理下:

  索引量和收录量:索引量是所有对搜素有价值页面的集合,这些页面有些对用户有价值,把这些页面输出出来就是收录量(不同的人可能定义不一样),有些页面仅仅对搜索引擎自身有价值,这些页面数量就造成了索引量高于收录量的数值。

  site结果数与相关结果值:我们很多时候会看到site结果一般如下图:

  


 

  我们看到一个问题,相关结果数为215,而site结果仅仅为40左右,两者差距甚大。造成期差距的原因可能是有多个因素造成的,比如有些网页可能被重复计算了,有些网页虽然被收录了(检索价值是有的)但是页面质量不高(网页价值和检索价值不是一码事,网页检索价值仅仅是网页价值的一个基础而已,而网页价值是多个因素组成的。)

  同时我们也要知道,蜘蛛毕竟是机器,而且互联网上很多网站的网页数量在不同地进行着变化,一直有新的网页产生和老网页的删除,我们某个时候看到的值是一个大体准确的值,而并不是100%准确的。

  从包含关系而言,这四者的关系大体如下:

  索引量大于收录量,收录量大于site结果数,而相关结果数是大于site结果数。不过在一般情况下,我们个人建议采用下面的方法简化这些关系:

  1,百度索引量=百度收录量,因为收录量其实是无法看到的,site结果数和相关结果值也无法代表收录量。

  2,site直接结果数对seo意义和价值较大,除了可以用site结果数来判断一些页面价值外,在收录上我们建议提高site结果数和百度索引量的比值、百度索引量与整个网站网页数量的比值,从这2个比值入手进行seo优化和操作。至于其中纠纠结结的概念这类的,直接无视就好了

 

时间: 2024-09-11 02:41:06

关于百度的索引量、收录量、site结果与相关结果的相关文章

了解索引、收录、site之间的关系

摘要: 同样的一本搜索引擎原理书籍,不同的人可能有不同的理解程度,而且一些以前的seo理论虽然已经根深蒂固了,但是在目前的seo情况下已经不太实用了,比如一个收录问题.其实想准确 同样的一本搜索引擎原理书籍,不同的人可能有不同的理解程度,而且一些以前的seo理论虽然已经根深蒂固了,但是在目前的seo情况下已经不太实用了,比如一个收录问题.其实想准确了解索引.收录.site这些之间的关系,我们可以从基本的原理出发去考虑一些问题. 从搜索原理上讲,蜘蛛先抓取到一个网页的URL,然后对这个URL对应网

索引量、收录量、site结果与相关结果

同样的一本搜索引擎原理书籍,不同的人可能有不同的理解程度,而且一些以前的seo理论虽然已经根深蒂固了,但是在目前的seo情况下已经不太实用了,比如一个收录问题.其实想准确了解索引.收录.site这些之间的关系,我们可以从基本的原理出发去考虑一些问题. 从搜索原理上讲,蜘蛛先抓取到一个网页的URL,然后对这个URL对应网页的内容进行下载.分析,对于符合其质量标准或有一定用途的网页进行索引,把索引后的网页放入索引数据库中.这时候索引库内的网页有些具有用户检索价值的,有些是具有搜索引擎自身的检索价值的

百度蜘蛛机器人爬行量与收录量的关系

大家一定都知道,百度蜘蛛机器人来爬行你网站的数量,远远大于收录量,那么它们之间到底有什么联系,今天我们就来谈谈. 一.初试期 我在这点说的初试期,指的是网站开通到给百度收录提交过后的一个星期,在这一个星期内,百度蜘蛛机人的活动方式是这样的,首先百度机器人会来爬行的提交网站的首页,然后过一会,在根据它分析的结果,有可能是一天或几分钟过后就在次来爬行,你首页上的其它页面.当然在这个阶段,机器人爬行首页次数会非常少,有可能一天只有几次爬行首页,主要是因为你网站上有很多链接,它得一个一个的爬.机器人的爬

提高网站百度收录量五种实战经验分享

百度收录量在某种程度上可以提高网站的知名度,促进流量的攀升,所以,在中小型网站起步阶段,想办法提高网站百度收录量和增加百度友好度就是一项很重要的工作了.作为世界工厂食品网的市场人员,在长期的工作过程中,也慢慢的积累了一些经验,简单的总结如下,以期对大家在网站建站初期有所帮助. 一:保证网站原创和伪原创力度 我们可以想象,当百度蜘蛛爬行到我们网站的时候,发现整个网站的信息都是从别的网站上转载过来,没有一点新鲜的信息,这样的话,又怎么能吸引百度蜘蛛的再次到访和提高拜访的频率呢? 以世界工厂食品网为例

百度蜘蛛机器人爬与收录量关系

们的网站只要你用心去观察蜘蛛机器人的爬行规律,根据不是阶段认真的作好总结,我想要不了多久,百度蜘蛛机器人会非常喜欢你站的 一.初试期 我在这点说的初试期,指的是网站开通到给百度收录提交过后的一个星期,在这一个星期内,百度蜘蛛机人的活动方式是这样的,首先百度机器人会来爬行的提交网站的首页,然后过一会,在根据它分析的结果,有可能是一天或几分钟过后就在次来爬行,你首页上的其它页面.当然在这个阶段,机器人爬行首页次数会非常少,有可能一天只有几次爬行首页,主要是因为你网站上有很多链接,它得一个一个的爬.机

请记住 你的网站总收录量不是site出来的

作为一名SEOER,我们每天都会关注着自己所负责站点的各项数据的变化,其中非常重要的一项就是网站页面的总收录量,且不说网站收录量的重要性以及对排名的重要性,今天我们就和大家聊一聊这个网站总收录量的问题,到底什么是网站的总收录?网站总收录可以从哪里看到?SITE命令返回的结果是不是就是我们网站真实的收录量等这几个问题,另外我们也可以顺便延伸一下,那么网站被K到底是一种什么样的症状,怎么看是真被K还是假被K呢? 下面我们围绕上面几个问题来进行一个简单的探讨. SITE查询出来的数量就是网站的总收录,

site值和百度工具索引值哪个是真实的网站收录

网站的收录量对一个网站的重要性是不言而喻的,可以有效提高网站权重,可以给网站带来大量长尾关键词流量.从而一个网站的收录量也是综合衡量一个网 站的重要参考因素.那么如何准确的查看网站的收录值呢?是网站site收录值为准确?还是百度站长工具后台索引值准确呢?下面由飞卖品工作室人员来详细解 答:   图一,网站site语法收录值   图二,百度站长工具后台索引值 看上面两个图,一个是网站的site收录值,一个是同网站的百度站长工具索引起.而显示出来同一个网站site收录值和百度站长工具后台索引值是不同

针对9月22日百度收录量普遍下降原因分析

9月22日,很大一部分站长在使用百度site命令时发现自己网站的收录量下降很多,在论坛中也遇到很多站长在询问9月22日是不是百度算法又更新了?如何应对9月22日百度收录量狂降现象?作为站长,我们应该理性对待百度对网站收录.排名等出现的一系列问题,不能单靠猜测去分析网站收录量下降现象.针对9月22日百度site命令网站收录量下降的原因,我们做一下科学的seo分析.用实例说明收录量下降的原因. 今天是9月24日,百度site命令查询的收录量依旧没有恢复,看图:   从上面的截图可以看出,使用site

百度收录量下降减少原因分析

2012年8月31日,SEO博客收录达到203,然后从9月1日到今天,百度收录量下降减少了很多,site:首页只有80多,百度官方一直强调说site数据量不准,通过百度站长工具后台查看SEO博客有将近200的索引量.另外domain:首页,在8月31日数据量有3380,现在只有1180.下面跟随SEO博客一起来分析一下. 8月31日数据的不稳定原因是什么? 360和百度之间的攻防大战在8月31日全面升级,百度对自己的搜索结果做了屏蔽,把搜索结果URL做了加密跳转,就是防止360进行抓取,所以数据