SEO新手必看 搜索引擎工作原理之一

  新手SEO是为了什么,也就是为了有一个好的排名,除了大型网站可以依靠长尾带来巨大的流量,一般的新站长能用SEO得到一个稳定的关键词排名,就能带来稳定的流量,网上SEO的文章多如牛毛,但自己也要有系统学习的流程,想得到好的排名,就要知道搜索引擎工作原理大致是怎么样的,详细的工作原理你就不用管了,据说全世界也没几个,废话不多说,进入正题。

  搜索引擎的工作原理是非常复杂的,前面就提过真正懂的全世界也没几个,但我们只要知道一些皮毛就够用了。搜索引擎的工作过程可以分为三个阶段。

  一.爬行和抓取

  这个大家都应该知道,就是搜索引擎的蜘蛛通过爬行链接访问网页,然后抓取页面的HTML代码存到服务器的数据库中。

  二.预处理

  这个是排名前的一个处理过程,索引程序对蜘蛛抓取来的页面数据进行文字提取,然后分词,索引等处理。

  三.排名

  当你在搜索框中输入你想查询的关键词时,排名程序调用索引库数据,计算相关性,然后生成搜索结果页面,到这里你就可以看到你搜索的结果了。

  看似简单的三个阶段,其实每一步的算法都是及其复杂的。今天先讲一下爬行和抓取:

  爬行和抓取是搜索引擎工作的第一步,完成数据的收集任务。

  为了抓取网上的内容,蜘蛛会跟踪页面上的链接,从一个页面爬到另一个页面,就跟蜘蛛在网上爬行是一样的,这就是蜘蛛这名字的来由。

  蜘蛛爬行方法有两种,第一种是深度优先,第二种是广度优先。深度优先是指蜘蛛沿着链接一直向前爬行,直到前面没有链接,然后返回到第一个页面,沿着另一个链接再爬下去。

  广度优化是指蜘蛛在一个页面上发现了多外链接,不是顺着一个链接向前爬行,而且把页面上的所有第一层的链接全爬一遍,然后再去爬第二层。

  事实上这两种方法是混合使用的,这样理论上是能够爬完整个互联网,但由于资源,时间的限制,往往只能爬行抓取一小部分,所以吸引蜘蛛是SEO必做的功课。所以我必要讲一下哪一些页面蜘蛛会去抓取或者抓取的概率高。

  1.与首页点击距离近,一般来说网站的首页权重是最高的,所以蜘蛛访问首页的频率最高,所以距离首页距离近的被抓取的概率高。

  2.页面更新快,蜘蛛每次爬行都会被数据存起来,如果第二次爬行没有变化的话,说明没有更新,蜘蛛就认为这页面没有必要经常抓取,如果你更新快的话,蜘蛛就会更新过来,这里说一点啊,在我以前我在A5发过的文章中也提过,就是更新最好有个时间表,每天固定时间更新,我贴上文章链接有兴趣的可以看下http://www.admin5.com/article/20100112/204187.shtml 。

  3.就是多去权重高的网站发点链接,这样同样也会提高被抓取的概率。

  还有一个要说的就是地址库,这里只是简单的说下,地址库主要就是防止重复爬行和抓取网址。今天就写到这里,明天会写有关预处理和排名的部分。本文由张家港弯管机 http://www.zjgjixie.com站长撰稿,转载请留链接。另需相关企业类,机械类网站做友情链接,有的请加QQ:26043721

时间: 2024-09-08 21:15:46

SEO新手必看 搜索引擎工作原理之一的相关文章

SEO新手必看 搜索引擎工作原理之二

搜索引擎工作原理的三个阶段: 1.爬行和抓取 2.预处理 3.排名 前天在A5上发过搜索引擎工作原理之爬行与抓取http://www.admin5.com/article/20110630/356286.shtml,有兴趣的可以去看下,现在接下去讲预处理,搜索引擎通过爬行和抓取以后存入数据库的原始页面,并不能直接用于查询排名处理.你可想像搜索引擎收录了多少的页面,如果等用户输入关键字再去进行运算排名,这显然是不现实的,所以这些页面就先经过预处理,这样在用户输入关键词时,排名程序就调用数据库里已经

SEO新手必看 SEO都该从哪做起

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 SEO新手必看!SEO都该从哪做起? 笔者现在在一家购物网做SEO,虽然从事SEO时间不长,但也算略有些经验,为了能让新手们更快进入此行业,我将通过站长平台发布个人心得,希望能给新手们带来一些小帮助! 作为SEO新手必然要做的2件事情: 1.要养号.您给一个公司做SEO,不是做完就不做的,而是长期的,这样你就要把你所注册的每一个网站记录清楚,

新手如何学习SEO技术?SEO新手必看

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 新手如何学习seo技术?很多seo新手一直会纠结于这个事,不知道从何做起,不知道该学习一些什么东西,不知道该如何下手去做--好吧,这么多的问题,今天,天津seo金山博客,来稍微谈谈我的个人见解,希望对新手朋友有所帮助. 我认为,学习seo技术需要掌握以下几点. 技能一:懂得搜索引擎的技术和原理; 技能二:掌握网站制作的相关知识,自己能独立做一

SEO新手必看:选择和确定网站目标关键词

一个网站的开发在网站的整个过程中占到不足百分之十,一个网站最重要的还是推广.如何快速而有效的推广,选择好网站的目标关键词非常重要.如何选择和确定网站的目标关键词是困扰很多SEO新手的话题,这里我以自己的实践来跟大家说下. 就目前来看中国最主流的搜索引擎是百度和谷歌,但是谷歌在中国的市场份额是越来越小,百度越来越多.并且谷歌对网站收录很好,从某些方面来说我们可以不去考虑谷歌搜索引擎.所以,就当前来做的话就是百度啦. 选择网站的目标关键词从百度指数开始 第一步就是根据你网站的类型,自己先想好几个跟你

SEO新手必看:选择稳定服务器托管的重要性

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 可能会让你感到惊讶的是,站点在哪托管对搜索引擎排名都有影响.然而,这将会是你做出的最重要的选择之一,草率地托管只能让你后悔不已. 如果你想知道一个站点(比如你的竞争对手)被谁托管,只需要访问www.seo-seo.com.cn 的whois查询,并把你想要查询的域名敲入搜索框中. 1.速度首先,需要注意到任何搜索引擎爬虫都有处理"超

肖玉强:图解搜索引擎工作原理

  做SEO的,如果不懂搜索引擎的工作原理是很难恰当开展工作的.前几天给学生讲SEO课程中的搜索引擎工作原理时,很多同学表示不太懂.后来我画了搜索引擎主要工作流程的示意图给大家,很多同学表示"懂了". 我们先来看搜索引擎的主要工作:页面收录.页面分析.页面排序及关键字查询.搜索引擎的工作流程是:页面收录--页面分析--页面排序--关键字查询. 一.搜索引擎工作原理--页面收录   搜索引擎工作原理示意图--页面收录流程 页面收录的最终目的是将网站上的内容加入到URL列表,积累URL资源

何涛:从搜索引擎工作原理折射出的SEO知识(中)

在前面一篇文章里(搜索引擎工作原理折射SEO知识上)有说到搜索引擎的工作原理的前部分也就是如何通过蛛蛛来抓取网络信息的问题.从中我们也了解到,蛛蛛的一些习性与SEO的一些操作小技巧.在今天的文章中我们会看到更多的有关于搜索引擎的内容,好了废话就不多说了. 我们都知道蛛蛛它毕竟还只是个程序而已,他做的工作不会通过网站的前台来分析一个网站内容,而是通过网站的代码来进行抓取信息的.而在网站的源代码里我们会看到好多html.js等一些程序的语句.而蛛蛛他只会对里面的文章感兴趣,也就是说他只提取网页里的一

何涛:从搜索引擎工作原理折射出的SEO知识(下)

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 在搜索引擎工作原理的最后一篇文章里就应该提下搜索引擎的排名了.通过蛛蛛在网络上的信息抓取到存储,其实还是为了最终用户搜索某个关键词搜索引擎能提供他真正想要的内容. 在用户搜索某个词的时候,搜索引擎做的第一件事还是要对我们的词进行必要的分词,这个也是前面的文章里有提到的,这里面的原理还是一样.但在排名时的处理中,搜索引擎会先进行一个交集的处理,

新手必看:无线路由器设置入门教程

一.无线路由器基本 使用方法拿到手的无线路由器,连接好电源,无线路由器一般背面有5个网线插孔,其中一个颜色会与另外四个不同.如图498)this.w idth=498;' onmousewheel = 'javascript:return big(this)' alt="新手必看:无线路由器设置入门教程" width="474" height="205" src="http://images.51cto.com/files/upload