SEO新手必看 搜索引擎工作原理之二

搜索引擎工作原理的三个阶段:
1.爬行和抓取
2.预处理
3.排名

前天在A5上发过搜索引擎工作原理之爬行与抓取http://www.admin5.com/article/20110630/356286.shtml,有兴趣的可以去看下,现在接下去讲预处理,搜索引擎通过爬行和抓取以后存入数据库的原始页面,并不能直接用于查询排名处理。你可想像搜索引擎收录了多少的页面,如果等用户输入关键字再去进行运算排名,这显然是不现实的,所以这些页面就先经过预处理,这样在用户输入关键词时,排名程序就调用数据库里已经经过预处理的数据,然后计算排名并显示给用户看。

我们以百度为例,搜索引擎会提取网页文件中的文字内容,然后根据这个内容进行中文分词,比如“弯管机价格”,将被分为“弯管” “弯管机” “价格”这三个词,看到这里你就会明白为什么我以前在文章中提到不要进行关键词堆积,因为堆积会有被认为作弊,不堆积也可以达到差不多的效果,所以说了解搜索引擎工作原理是非常重要的。

中文中常有一些词出现在频率非常高,但实际上对内容没有任何影响,比如“的”“地”“得”“啊”“呀”之类的,这些词被称为停止词,搜索引擎去去些停止词,使主题更加突出。还有就是比如网站都会有的版权信息,广告之类的东西,这个一般也会去掉。在这些之后,搜索引擎还会去页面进行去重,就是同一篇文章经常会重复出现在不同网站,会删除重复内容。这点不是绝对的,因为种种原因,重复内容还是会存在,但我们最好还是坚持原创,至少得伪原创,这里说一下,所谓的伪原创应该怎么做,先继续说完去重之点,之后你就会明白应该怎么去做伪原创,去重的基本方法是对页面特征关健词进行计算,也就是对页面主体内容中选取最具有代表性的一部分关键词,这部分关键词经常是出现频率最高的关键词,一般会选取十个左右,所以你简单的改个段首,改变段落顺序也不能使文章变为原创,所以关键是改变关键词,比如文中的关键词是计算机,你就改成电脑,总之把出现频率最高的的关键词替换掉,这样才有可能达到原创的结果。

经过以上步骤,搜索引擎提取页面上的关键词,按照分词程序划分好的词,把页面转换成一个关键词组成的集合,同时记录每一个关键词在页面上的出现频率,位置等等,这样,每个页面就被记录成一串关键词集合。然后再按关键词进行排列,每个关键词对应一系列的页面,当用户搜索这个关键词时,排序程序就找到这个关键词,然后就可以看到有这个关键词的所有的页面了。

还有补充的一点就是链接关系,页面上有哪些链接指向哪些页面,每个页面有哪些导入链接,链接使用了什么锚文字,这些复杂的链接指向关系形成了网站和页面的链接权重。这个要讲起来得花很多的时间,以后如果有空的话我再单独写一下。

明天有空的话会写排名原理,今天还有好多事要做,本文由张家港弯管机   http://www.zjgjixie.com站长撰稿,转载请留链接。另需相关企业类,机械类网站做友情链接,有的请加QQ:26043721

时间: 2024-08-04 04:19:49

SEO新手必看 搜索引擎工作原理之二的相关文章

SEO新手必看 搜索引擎工作原理之一

新手SEO是为了什么,也就是为了有一个好的排名,除了大型网站可以依靠长尾带来巨大的流量,一般的新站长能用SEO得到一个稳定的关键词排名,就能带来稳定的流量,网上SEO的文章多如牛毛,但自己也要有系统学习的流程,想得到好的排名,就要知道搜索引擎工作原理大致是怎么样的,详细的工作原理你就不用管了,据说全世界也没几个,废话不多说,进入正题. 搜索引擎的工作原理是非常复杂的,前面就提过真正懂的全世界也没几个,但我们只要知道一些皮毛就够用了.搜索引擎的工作过程可以分为三个阶段. 一.爬行和抓取 这个大家都

SEO新手必看 SEO都该从哪做起

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 SEO新手必看!SEO都该从哪做起? 笔者现在在一家购物网做SEO,虽然从事SEO时间不长,但也算略有些经验,为了能让新手们更快进入此行业,我将通过站长平台发布个人心得,希望能给新手们带来一些小帮助! 作为SEO新手必然要做的2件事情: 1.要养号.您给一个公司做SEO,不是做完就不做的,而是长期的,这样你就要把你所注册的每一个网站记录清楚,

新手如何学习SEO技术?SEO新手必看

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 新手如何学习seo技术?很多seo新手一直会纠结于这个事,不知道从何做起,不知道该学习一些什么东西,不知道该如何下手去做--好吧,这么多的问题,今天,天津seo金山博客,来稍微谈谈我的个人见解,希望对新手朋友有所帮助. 我认为,学习seo技术需要掌握以下几点. 技能一:懂得搜索引擎的技术和原理; 技能二:掌握网站制作的相关知识,自己能独立做一

SEO新手必看:选择和确定网站目标关键词

一个网站的开发在网站的整个过程中占到不足百分之十,一个网站最重要的还是推广.如何快速而有效的推广,选择好网站的目标关键词非常重要.如何选择和确定网站的目标关键词是困扰很多SEO新手的话题,这里我以自己的实践来跟大家说下. 就目前来看中国最主流的搜索引擎是百度和谷歌,但是谷歌在中国的市场份额是越来越小,百度越来越多.并且谷歌对网站收录很好,从某些方面来说我们可以不去考虑谷歌搜索引擎.所以,就当前来做的话就是百度啦. 选择网站的目标关键词从百度指数开始 第一步就是根据你网站的类型,自己先想好几个跟你

SEO新手必看:选择稳定服务器托管的重要性

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 可能会让你感到惊讶的是,站点在哪托管对搜索引擎排名都有影响.然而,这将会是你做出的最重要的选择之一,草率地托管只能让你后悔不已. 如果你想知道一个站点(比如你的竞争对手)被谁托管,只需要访问www.seo-seo.com.cn 的whois查询,并把你想要查询的域名敲入搜索框中. 1.速度首先,需要注意到任何搜索引擎爬虫都有处理"超

肖玉强:图解搜索引擎工作原理

  做SEO的,如果不懂搜索引擎的工作原理是很难恰当开展工作的.前几天给学生讲SEO课程中的搜索引擎工作原理时,很多同学表示不太懂.后来我画了搜索引擎主要工作流程的示意图给大家,很多同学表示"懂了". 我们先来看搜索引擎的主要工作:页面收录.页面分析.页面排序及关键字查询.搜索引擎的工作流程是:页面收录--页面分析--页面排序--关键字查询. 一.搜索引擎工作原理--页面收录   搜索引擎工作原理示意图--页面收录流程 页面收录的最终目的是将网站上的内容加入到URL列表,积累URL资源

何涛:从搜索引擎工作原理折射出的SEO知识(中)

在前面一篇文章里(搜索引擎工作原理折射SEO知识上)有说到搜索引擎的工作原理的前部分也就是如何通过蛛蛛来抓取网络信息的问题.从中我们也了解到,蛛蛛的一些习性与SEO的一些操作小技巧.在今天的文章中我们会看到更多的有关于搜索引擎的内容,好了废话就不多说了. 我们都知道蛛蛛它毕竟还只是个程序而已,他做的工作不会通过网站的前台来分析一个网站内容,而是通过网站的代码来进行抓取信息的.而在网站的源代码里我们会看到好多html.js等一些程序的语句.而蛛蛛他只会对里面的文章感兴趣,也就是说他只提取网页里的一

何涛:从搜索引擎工作原理折射出的SEO知识(下)

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 在搜索引擎工作原理的最后一篇文章里就应该提下搜索引擎的排名了.通过蛛蛛在网络上的信息抓取到存储,其实还是为了最终用户搜索某个关键词搜索引擎能提供他真正想要的内容. 在用户搜索某个词的时候,搜索引擎做的第一件事还是要对我们的词进行必要的分词,这个也是前面的文章里有提到的,这里面的原理还是一样.但在排名时的处理中,搜索引擎会先进行一个交集的处理,

新手必看:无线路由器设置入门教程

一.无线路由器基本 使用方法拿到手的无线路由器,连接好电源,无线路由器一般背面有5个网线插孔,其中一个颜色会与另外四个不同.如图498)this.w idth=498;' onmousewheel = 'javascript:return big(this)' alt="新手必看:无线路由器设置入门教程" width="474" height="205" src="http://images.51cto.com/files/upload