SEOer需要了解搜索引擎的索引器

  一个合格的SEOer需要对搜索引擎的结构有一定的了解,这样在进行seo时可以做到心中有数,有条不紊,而不必拘泥于固定的优化方法和技巧。而此时要分析的索引器,它是搜索引擎结构中一个比较重要部分。

  索引 器第对搜索引擎是比较重要的,比如:我们熟悉的百度新闻,它是“由机器每5分钟自动选取更新”,比较具有实时性,并且数据量也是相当的大。此时索引器的算法对索引器的影响就显得十分突出了。因此有人说,一个搜索引擎的有效性在很大的程度上取决于索引器的质量(精确的说应该归功于索引器的索引算法)。

  下面我们一起来系统了解索引器的功能,索引器的功能是理解搜索器(之前我在A5上发表过一篇“SEO需知其所以然之——搜索器”的介绍)搜索的信息,并对收集回来的网页进行分析,提取相关网页信息,如网页的关键词,页面使用的编码,网页URL等等。然后更具搜索引擎的相关算法进行大量复杂的计算,得到一些相关信息,然后利用这些相关信息建立相应的网页索引数据库。

  1. 索引项

  通过前面的介绍,你一定了解了索引器的一些知识,下面有必要对索引项有所了解。什么是索引项了?举个例子,比如我们平时所说的索引器索引的时间,编码,作者,标题等等都属于索引项。

  索引项可以分为两种,一种是客观索引项,另一种是内容索引项。其中客观索引项是与文档的内容无关的,比如,我们发一遍帖子,里面的发帖作者,发帖时间,帖子地址等等都是客观索引项;而内容索引项是反应文档内容的,其理解起来就很容易了,在此就不举例了。内容索引又可以分为单索引项和多索引项两种。

  2. 中文分词

  提供中文分词,你一定会想到全球最大的中文搜索引擎——百度,因为百度搜索引擎在中文分词上有着深厚的技术功底。一般搜索引擎索引英语单词或者句子时候,是比较容易提取的,因为英文单词之间是用空格分开的,而这一切都是约定俗成的。但是对于汉语书写的句子,就不能凭空格区别了,必须要进行词语的切分,也就是我们常说的分词。

  中文分词是文本提取的基础,对于输入的一段中文,然后进行中文分词,然后搜索引擎达到识别语句含义的效果。

  中文分词的方法一般可以分两种,一种是机械匹配方法(基于字符串匹配的分词方法),另一种是概率统计方法。其中机械匹配是建立在已有的词典大全上的,是和里面词语匹配而得到的分词结果。它一般分词方法有:正向最大匹配法(由左到右的方向),逆向最大匹配法(由右到左的方向),最少切分(使每一句中切出的词数最小)和双向最大匹配法(进行由左到右、由右到左两次扫描)。概率统计方法是通过概率统计后,然后再进行处理而得到分词。

  3. 对seo的启示

  根据上面分析搜索引擎索引器的原理,我们可以粗略判断一个搜索引擎的技术成熟程度,例如上面说到百度5分钟自动更新新闻。如果网站是新闻资讯类的,可以注重信息发布的实时性;我们在确定网站的核心关键词和关键词时根据中文分词原理,去掉冗余的词语,把网站最核心的关键词反馈给搜索引擎,这样搜索引擎会给网站一个不错的排名。

  seo技术不仅仅是这一方面就能攻无不克的,还需要整体了解搜索引擎的结构和工作原理的。当然我会在后面陆续分享一些搜索引擎的知识,并分享自己根据这些原理和几年的seo实战经验。

  本文由九州站长学院(http://www.9cms.com/)原创,首发于A5,转载请注明文章来源;同时热忱欢迎广大从事seo的朋友一起交流,共同进步。谢谢!

时间: 2024-10-31 16:35:17

SEOer需要了解搜索引擎的索引器的相关文章

C#锐利体验之第八讲 索引器与操作符重载

索引 索引器 索引器(Indexer)是C#引入的一个新型的类成员,它使得对象可以像数组那样被方便,直观的引用.索引器非常类似于我们前面讲到的属性,但索引器可以有参数列表,且只能作用在实例对象上,而不能在类上直接作用.下面是典型的索引器的设计,我们在这里忽略了具体的实现. class MyClass{    public object this [int index]    {        get        {            // 取数据        }        set  

羽毛:seoer必备高级搜索引擎指令进阶(下)

前几天<羽毛:seoer必备高级搜索引擎指令进阶(上) >中给大家分享了精准完整匹配""的使用;通匹配*的使用;还有inurl这个高级指令来寻找所需网站.有不少站长朋友看了大呼过瘾,觉得对其有帮助,加我好友,进群交流,询问其他指令;这里羽毛再继续分享,希望能够对朋友们有所帮助,乐哉! 1,intitle搜索指令:使用 intitle指令返回的是页面title中包含关键词的页面. 这个指令百度和谷歌都是支持的.比如我要看下哪些页面标题里包含"羽毛seo",

概述C#中的索引器

索引 C#语言一个最令人感兴趣的地方就是类的索引器(indexer).简单说来,所谓索引器就是一类特殊的属性,通过它们你就可以像引用数组一样引用自己的类.显然,这一功能在创建集合类的场合特别有用,而在其他某些情况下,比如处理大型文件或者抽象某些有限资源等,能让类具有类似数组的行为当然也是非常有用的.本文就会引领你设置类来采用索引器.但是,首先让我们概述下属性这个概念以便了解些必要的背景知识. 属性 假如你曾经用VB6编写过程序,那么你应该很熟悉属性方法才对,所谓属性方法其实就是特殊的类成员,它实

SEOer如何做好搜索引擎的debugger

这几天有点忙,有个新站在上,但是眼看着百度这段时间的算法改变,我真的心里有点着急,SEOer真的就这么不招它待见吗? 今天我主要想阐述下SEO行业在百度的敌视下,我们应该如何摆正自己心态,正确对待搜索引擎优化行业,使用正确方法,从而使百度能对SEO行业改观. 在中国其实SEO行业一直是不被承认的,或者说是不被正式承认,为什么这样说呢,你仔细想想,有没有听说过哪个高校里面有开设SEO课程的,我估计应该很少或者根本就没有.中国的搜索引擎一路成长以来,百度一直是首当其冲,自从悲剧的谷歌被边缘化了之后,

通过索引器简化C#类型信息访问

前言 作为一个有别于Java.Ruby等语言的一个特性,C#可以用索引器(Indexer)将类型本身以对象数组的形式供外部使用.下面是一个对比:(为了简化,略去了边界检查) 相关厂商内容 QClub:当SOA遭遇现实(7.26 杭州) 不难看出通过引入索引器,我们的目标类型DataAccess在涉及到根据编号检索的时候看上去更接近一个数组的样子,客户程序的开发人员不用关心具体的方法名称是GetData/GetInternalData或者是SetData/ UpdateData,仅仅把它当成一个数

C#下的BitArray类:实现索引器和位操作

System.Collections命名空间下的BitArray相当于一个bool类型的数组bool[].MSDN用 BitArray做例子实现了一个索引器,今天研究了一下这个例子,对原来的实现做了一些改变 ,将>> 5操作变成了mod 32,敝人以为这样看起来会更直观. 代码如下: public class MyBitArray { private int[] m_Bits; private int m_Length; public MyBitArray(int length) { //Co

使用C#索引器

索引器在语法上方便您创建 客户端应用程序可将其作为数组访问的类.结构或接口.索引器经常是在主要用 于封装内部集合或数组的类型中实现的.例如,假定具有一个名为TempRecord的 类,此类表示在24小时内的10个不同时间记录的华氏度.此类包含一个表示温度 的float类型的名为"temps"的数组和表示记录温度的日期的 DateTime.通过在此类中实现一个索引器,客户端可以通过floattemp=tr[4]而 不是floattemp=tr.temps[4]语法访问TempRecord

C#——运算符重载和索引器

       一.什么是运算符?        所谓运算符重载,就是对已有的运算符重新进行定义,赋予其另一种功能,以适应不同的数据类型.自定义类的赋值运算符重载函数的作用与内置赋值运算符的作用类似,但是要要注意的是,它与拷贝构造函数与析构函数一样,要注意深拷贝浅拷贝的问题,在没有深拷贝浅拷贝的情况下,如果没有指定默认的赋值运算符重载函数,那么系统将会自动提供一个赋值运算符重载函数.        下面是个小例子: namespace 运算符重载 { class Program { static

用索引器简化的C#类型信息访问

"C#中的Indexer给人一种更'透彻'的感觉,集合类型就是集合类型,有自己专用但又最简洁的访问方式,而且同一类型可以有不同的索引访问方式."    --<设计模式_基于C#的工程化实现及扩展> 示例代码 using System; using System.Collections.Generic; using System.Linq; using System.Text; namespace BangWorks.PractcalPattern.Concept.Inder