了解索引、收录、site之间的关系

摘要: 同样的一本搜索引擎原理书籍,不同的人可能有不同的理解程度,而且一些以前的seo理论虽然已经根深蒂固了,但是在目前的seo情况下已经不太实用了,比如一个收录问题。其实想准确

同样的一本搜索引擎原理书籍,不同的人可能有不同的理解程度,而且一些以前的seo理论虽然已经根深蒂固了,但是在目前的seo情况下已经不太实用了,比如一个收录问题。其实想准确了解索引、收录、site这些之间的关系,我们可以从基本的原理出发去考虑一些问题。

从搜索原理上讲,蜘蛛先抓取到一个网页的URL,然后对这个URL对应网页的内容进行下载、分析,对于符合其质量标准或有一定用途的网页进行索引,把索引后的网页放入索引数据库中。这时候索引库内的网页有些具有用户检索价值的,有些是具有搜索引擎自身的检索价值的,对于对用户有检索价值的被索引的网页,会进行输出,也即是我们说的收录。而对仅仅有搜索引擎自身检索价值的网页可能并不输出,仅仅有一定的索引量而没有输出结果数,因此我们可以看到很多时候收录量会比索引量低很多。

站在搜索的角度而言,一个网站的网页数量有时候是大于目前所拥有的网页数量的。举例来讲,比如一个站有100个网页,对于用户或者站长而言,是100个网页,但是这100个网页可能进行了数据更新,网页改变等多个操作,不同版本或许能满足不同的需求,(因此我们也可以看到很多时候一个网页有不同的快照。)从这个角度而言,在搜索的眼中一个网站的网页数量是可以大于网站目前所拥有的输出网页数量的,特别对于频繁修改的网站或者URL不规范的站点。同时,站在搜索引擎的数据角度而言,其数据量可能由历史数据和更新数据等组成的,因此site相关结果值也大于site结果数。

依据上面的说法,我们把四者的关系重新梳理下:

索引量和收录量:索引量是所有对搜素有价值页面的集合,这些页面有些对用户有价值,把这些页面输出出来就是收录量(不同的人可能定义不一样),有些页面仅仅对搜索引擎自身有价值,这些页面数量就造成了索引量高于收录量的数值。

site结果数与相关结果值:我们很多时候会看到site结果一般如下图:

我们看到一个问题,相关结果数为215,而site结果仅仅为40左右,两者差距甚大。造成期差距的原因可能是有多个因素造成的,比如有些网页可能被重复计算了,有些网页虽然被收录了(检索价值是有的)但是页面质量不高(网页价值和检索价值不是一码事,网页检索价值仅仅是网页价值的一个基础而已,而网页价值是多个因素组成的。)

同时我们也要知道,蜘蛛毕竟是机器,而且互联网上很多网站的网页数量在不同地进行着变化,一直有新的网页产生和老网页的删除,我们某个时候看到的值是一个大体准确的值,而并不是100%准确的。

从包含关系而言,这四者的关系大体如下:

索引量大于收录量,收录量大于site结果数,而相关结果数是大于site结果数。不过在一般情况下,我们个人建议采用下面的方法简化这些关系:

1,百度索引量=百度收录量,因为收录量其实是无法看到的,site结果数和相关结果值也无法代表收录量。

2,site直接结果数对seo意义和价值较大,除了可以用site结果数来判断一些页面价值外,在收录上我们建议提高site结果数和百度索引量的比值、百度索引量与整个网站网页数量的比值,从这2个比值入手进行seo优化和操作。至于其中纠纠结结的概念这类的,直接无视就好了。

起源seo论坛http://www.wocaoseo.com/原创。

时间: 2024-08-02 00:01:20

了解索引、收录、site之间的关系的相关文章

百度索引和site差别太大经过投诉放出来后的心得分享

对于很多站长而言,网站被K或者是被百度降权后的一段时间里,网站的收录始终不放出来是个很让人头疼的问题,在这个过程中有个考核期,这个考核的时间在一个月左右,在这个期间每天都要扎实的坚持网站的内容和外链建设,尤其要把好这两方面的质量关,内容和外链在于精不在于多,这个过程是比较痛苦的,因为你每天做的事情看不到任何成效 ,尤其体现在收录的增长上,没有收录很难有好的排名,但是这个考核期过了以后该怎么善意的提醒一下百度把自己的网站解救出来呢,先来说说我自己的亲身体验. 我手头有一个朋友的网站,因为采集被K之

总结java实现八大排序算法及之间的关系

8种排序之间的关系: 1, 直接插入排序 (1)基本思想:在要排序的一组数中,假设前面(n-1)[n>=2] 个数已经是排 好顺序的,现在要把第n个数插到前面的有序数中,使得这n个数 也是排好顺序的.如此反复循环,直到全部排好顺序. (2)实例 (3)用java实现 [java] view plaincopy package com.njue; public class insertSort { public insertSort(){ inta[]={49,38,65,97,76,13,27,

XML和数据库之间的关系

xml|数据|数据库  1.0 简介    本论文简要的探讨了XML和数据库之间的关系,同时列出一些可以使用数据库处理XML文档的软件. 虽然这里不打算详尽地介绍这些软件,但是笔者希望它能够描述使用数据库处理XML文档中的主要部分.这里有点偏向与关系数据库,因为我的经验如此.     2.0 XML是数据库吗?     在开始讨论XML和数据库之前,我们需要回答一个萦绕在很多心头的问题: "XML是数据库吗?"在严格意义上将,如果"XML"是指XML文档时,答案是&

中文Access2000速成教程--1.8 定义表之间的关系

access|教程|速成|中文 第八讲 定义表之间的关系 前面定义了主键,以及相应的表后,就可以制定各表部的关系,从而建立起一个关系数据库.的应用与管理关系数据库,中文Access 2000具有很强的能力,这正是中文Visual FoxPro 6与中文Excel 2000所不及的.为了建立关系数据库,首先要建立好各相关表,接着将它们全部关闭,即可按下列步骤进行操作. 注意:中文Access 2000不能在已打开的表之间创建或修改关系,所以要关闭所有打开的表,这与中文Visual FoxPro 6

三方面诠释内页收录与排名的关系

平时大家都非常注意网站的收录量,很多站长都认为网站的整体收录量变大,那么网站的权重也就会随之变大.姑且先不说这个观点的对与错,就那网站的收录来说,网站的排名是否真的和内页收录有关系,收录量的增大会给网站带来哪些积极的变化,今天本文和大家从三个方面做一个详细的探讨.在开始之前,首先看一个调查图:   这个图就是最近SEOER们做的一个调查,从图我们可以看出,大部分的SEOER都认为网站的内页收录和排名之间是有关联的,而且关联还比较大,麦文文也认同这个观点,下边就从三个方面说说我的理由. 第一.带动

sql-请问索引和外键什么关系?

问题描述 请问索引和外键什么关系? 在百度上搜到的全都是"有外键没索引" 想知道如果建立了索引,却没有建立外键,那么在链接查询中是什么体现呢? 解决方案 外键是用来关联两个表的,索引是用来加速表查询的. 解决方案二: 为了优化性能,数据库一般都会对主键创建索引. 解决方案三: 外键通俗点讲就像门牌号码,人家要找你必须通过门牌号码去找到你住在哪.索引就像地图,上面记载了各种你设定的门牌号码,你能通过索引快速找到你想要的 解决方案四: 主键 是唯一的是用来关联表之间的关系的.外键和 索引是

MySQL 查找锁之间依赖关系的信息和最源头锁的thread_id号及关系

链接: http://blog.itpub.net/28602568/viewspace-1874982/ 标题: MySQL 查找锁之间依赖关系的信息和最源头锁的thread_id号及关系 作者:lōττéry版权所有[文章允许转载,但必须以链接方式注明源地址,否则追究法律责任.] #mysql 锁之间的依赖关系信息sql如下[打开注释部分的sql是查找最源头锁的thread_id线程id及关系]      SELECT distinct b.trx_id blocking_trx_id, 

浅谈网站源码与SEO之间的关系

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 众所周知,目前我们建站已经有越来越多的开源程序了,像CMS里有织梦.帝国.PHP168等,论坛用的Discuz.PHPWIND等,博客里的Zblog.wordpss等等吧,这些都提供用户免费下载使用,这只是几款比较知名的程序,当然还有很多不知名的程序,对我们草根站长而言,目前的这些开源程序已经足够我们选择和使用了,究竟选择什么样的源码建站,目

中文Access2000速成教程--1.8 定义表之间的关系_Access

注意:中文Access 2000不能在已打开的表之间创建或修改关系,所以要关闭所有打开的表,这与中文Visual FoxPro6有些不一样. 步骤一.按下键盘上的F11功能键,将当前操作窗口切换到"数据库"窗口. 步骤二.单击"数据库"工具栏中的"关系"按钮,参见图39. 此后,如果当前数据库中已经存在着关系表,屏幕上就将显示如图40所示的"关系"对话框.如果当前数据库没有定义任何关系,中文Access 2000将会自动显示&