浅谈搜索引擎分析关键词的工作原理

  搜索引擎的横空出世,让我们更容易使用互联网,十年前的信息爆炸言论现在已经基本停息,这些都归功于搜索引擎,因为信息再多,已经有搜索引擎帮我们分类整理,我们想要的时候只要输入相关的关键词就能够找到相应的信息,就不会再存在那种信息爆炸式的状态,找一个信息会把一个人折磨的半死!可见搜索引擎的贡献和作用是多么的巨大!

  我们平时找信息都是通过输入数据来获得,也就是我们常说的关键词,搜索引擎对于输入的关键词是如何工作的,是直接通过这个词来找,还是要把这些词分开,进行相关的比对再从数据库中找,然后再根据这次词来进行排名,很多人对这个工作原理还不是很清楚,笔者因为在SEO优化行业工作多年,对于搜索引擎的分词原理也有了一定的了解,下面就把我的理解写下来跟大家讨论一下!

  一:首先就是分词,这是搜索引擎都要做的工作,因为我们在搜索框里面输入的词有时候是短语,有时候就是一个完整的句子,很少是用词组来直接搜索的,所以搜索引擎在正式工作之前要把输入的短语或者句子进行切分,然后把这些字符串变成词组的组合,不能够再分割了,然后在通过预处理的数据库进行查询和比对,把符合这些词的数据返回给用户,这个分词其实和页面分词差不了多少!

  二:去掉停止词,所谓停止词都是一些没有实际意义的词,比如一些啊,哦等等语气词,这些词往往会在搜索的时候被输入搜索框里面,此时搜索引擎在正式和数据库比对的时候会把这些没有意义的停止词取消然后保证搜索的准确性!

  三:如何处理指令,对于搜索引擎处理搜索命令式,会把很多默认的词组变成一个短语来进行搜索,这样能够保持较高的准确性,比如你在搜索框里面输入xx减肥xx网站,此时实际上被执行的命令是减肥网站,而不是全部的xx减肥xx网站返回结果,但是往往会返回一些单独的这些词的内容,比如单独的减肥内容等等!另外指令执行的时候还要粗粒各种高级的搜索命令,比如特定的标识符,如加减号等等!

  四:对输入词的矫正,因为汉字很多都有谐音,有时候写词组还很容易出现错别字,这时候搜索引擎往往也能够返回正确的结果来,这就是因为搜索引擎在分词的过程中,将一些错别字给矫正过来了,而且在返回的结果页面的上方还会出现纠正后的正确词组出来!如图:

  


  五:分类区分对待,不同的词语会不同的对待,这是搜索引擎的一个独特功能,如果你搜索的一般的关键词,那么返回的结果就是一般的网页,而如果你搜索的是新闻热词或者明星关键词时往往返回的就是相关的新闻源,所以搜索引擎在这方面的智能是相当高的!

  上面就是笔者对于搜索引擎对关键词的工作原理从五个方面进行了简单的介绍,虽然这个原理对于我们做网站没有直接的关系,但是在网站的优化方面还是有很大帮助到,毕竟涉及到关键词的分析和选择,所以认识这个原理对于我们个人站长们来说也是非常必要的!来源:www.che2.com 二手车市场原创,转载请说明!

时间: 2024-11-18 23:49:38

浅谈搜索引擎分析关键词的工作原理的相关文章

浅谈搜索引擎优化中的投票原理和操作误区

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 随着互联网的飞速发展,SEO行业近年来竞争愈演愈烈,百度算法的频繁变动更使SEO行业处于水深火热之中,许多行业运营人员表明:网站利用SEO优化所带来的效果远不如以前,甚至许多企业都放弃了SEO优化.其实这并不是明智的决策,只要更深入的了解之后,我们会发现竞争越激烈表示SEO在网站运营中的地位更加重要,而且笔者敢断言,在今后的互联网中,企业网站

浅谈web上存漏洞及原理分析、防范方法(文件名检测漏洞)_php技巧

我们通过前篇:<浅谈web上存漏洞及原理分析.防范方法(安全文件上存方法)>,已经知道后端获取服务器变量,很多来自客户端传入的.跟普通的get,post没有什么不同.下面我们看看,常见出现漏洞代码.1.检测文件类型,并且用用户上存文件名保存 复制代码 代码如下: if(isset($_FILES['img'])){    $file = save_file($_FILES['img']); if($file===false) exit('上存失败!');  echo "上存成功!&q

第二课笔记:搜索引擎基础知识和工作原理

  大家好,我是专门从事SEO的,几个月来一直都在维护和优化按摩器排行榜www.yziyuan.com这个网站,并从中总结了很多的经验和知识.今天要分享的是<搜索引擎基础知识和工作原理>,这是最基本的概念吧, 第一部分:什么是搜索引擎? 1,定义? 官方定义: 搜索引擎是指根据一定的策略.运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统.百度和谷歌等是搜索引擎的代表. 我的理解是: 按照搜索引擎的搜索规则去设置目标网站的

浅谈C++中虚函数实现原理揭秘_C 语言

编译器到底做了什么实现的虚函数的晚绑定呢?我们来探个究竟.      编译器对每个包含虚函数的类创建一个表(称为V TA B L E).在V TA B L E中,编译器放置特定类的虚函数地址.在每个带有虚函数的类 中,编译器秘密地置一指针,称为v p o i n t e r(缩写为V P T R),指向这个对象的V TA B L E.通过基类指针做虚函数调 用时(也就是做多态调用时),编译器静态地插入取得这个V P T R,并在V TA B L E表中查找函数地址的代码,这样就能调用正确的函数使

分析DDNS的工作原理及检测IP地址变化的实现

本文通过分析 DDNS 的工作原理,简单演示了其在 Linux 网络协议栈的内核空间及用户空间创建 netlink 套接字.进行数据交换.并最终通过 nsupate 工具将更新消息发送给 DNS 服务器的过程. DDNS 的实现最根本的一点是当主机的 IP 地址发生变化的时候,实现 DNS 映射信息的及时更新,应用程序需要及时地获得这一信息,主要的方法可分为两大类: 一类是轮询机制,即:应用程序每隔一定的时间,去从查询主机当前的 IP 地址,并与之前的进行比较,从而判断网络地址是否发生了变化.显

浅谈javascript中new操作符的原理_基础知识

javascript中的new是一个语法糖,对于学过c++,java 和c#等面向对象语言的人来说,以为js里面是有类和对象的区别的,实现上js并没有类,一切皆对象,比java还来的彻底 new的过程实际上是创建一个新对象,把新象的原型设置为构造器函数的原型,在使用new的过程中,一共有3个对象参与了协作,构造器函数是第一个对象,原型对象是二个,新生成了一个空对象是第三个对象,最终返回的是一个空对象,但这个空对象不是真空的,而是已经含有原型的引用(__proto__) 步骤如下: (1) 创建一

浅谈HTTP使用BASIC认证的原理及实现方法_java

一.BASIC认证概述 在HTTP协议进行通信的过程中,HTTP协议定义了基本认证过程以允许HTTP服务器对WEB浏览器进行用户身份证的方法,当一个客户端向HTTP服务 器进行数据请求时,如果客户端未被认证,则HTTP服务器将通过基本认证过程对客户端的用户名及密码进行验证,以决定用户是否合法.客户端在接收到HTTP服务器的身份认证要求后,会提示用户输入用户名及密码,然后将用户名及密码以BASE64加密,加密后的密文将附加于请求信息中, 如当用户名为anjuta,密码为:123456时,客户端将用

浅谈搜索引擎的工作原理及未来算法调整方向

在A5站长网上摸爬滚打了多年了,期间也写了好几篇的文章,其中有一篇<浅谈地方汽车门户网站运营的四个问题>还被推荐到了首页,我发给我们的朋友看的时候,大家对我这个曾经的菜鸟也开始刮目相看了,这让我本人在这段时间身心都愉悦的很,现在又忍不住在A5上发表一下我对搜索引擎工作原理及算法上的认识,可能比较的浅陋,但是有了想法,不吐还是不快的! 做网站SEO是一个非常枯燥的过程,很多人估计除了吃饭睡觉剩下来的时间就奉献给了电脑了,这样怎么能够把身体搞好呢?这不现在每天爬六楼都累得不行,这对于一个大小伙子实

[原创]再谈 unlocker 编程”探险”及工作原理

Unlocker的编程"探险"及工作原理  关键字:文件对象,NT用户态,内核态 Unlocker是偶写的一个文件解锁小工具,原来GUI用的是C# 2005编写,功能逻辑用的 是纯汇编加少量的C语言编写.现在为了不依赖于.Net Framework 平台,CUI用VB6.0 重写,而功能逻辑全部用C语言改写.   VB6对于GUI的快速开发以及"便携绿色化"还是比较优秀的一款工具,虽然他对漂亮 的XP皮肤支持有限(比如一些控件无法XP Skin化),甚至有些人会认为