搜索引擎如何进行语义分析

摘要: 根据 搜索引擎判断原创的指纹算法 我们知道搜索引擎可以把网页里面正文信息,提取一定的信息,可以是关键字、词、句子或者段落及其在网页里面的权重等形成一个信息指纹或特定

根据搜索引擎判断原创的指纹算法我们知道搜索引擎可以把网页里面正文信息,提取一定的信息,可以是关键字、词、句子或者段落及其在网页里面的权重等形成一个信息指纹或特定一个特征,通过这个特征来区分不同的两篇文档,然而这个只是搜索引擎非常程序化的一个判断,这就不可避免会导致了搜索结果会出现很多的失误,因为对于两篇文档的关联判断不只决定于正文信息,还取决于信息背后的语义关联。而这一点搜索引擎一直在努力中,现在谷歌的整句搜索和百度的知心搜索都是语义搜索,就是对信息背后语义关联的挖掘,这可以让用户的搜索结果更加智能化,提供更加符合用户需求的搜索结果。

我们来看下以下2个句子,看看是否有关联

“iphone5多少钱?”

“苹果价格会不会降?”

很显然,如果是我们看,这2个句子肯定是有关联的,虽然这两个句子之间没有任何公共词语。虽然第二句中的“苹果”可能是指吃的苹果,但是由于第一句里面有了“iphone5”,我们会很自然的把“苹果”理解为手机产品,而仅仅靠传统的指纹算法是不会有这个效果的。人可以通过上下文语境很简单的来判断2句话的语义,那么搜索引擎是如何进行语义分析,判断它们之间的关联呢?这就要说到语义主题。

语义主题是什么?

语义主题就是文字中隐含的主题,上面的例子“苹果”这个词的背后既包含是苹果公司这样一个主题,也包括了水果的主题。当我们和第一句进行比较时,苹果公司这个主题就和“iphone”所代表的主题匹配上了,因而我们才会认为它们是相关联的。

主题就是一个概念、一个方面,它表现为一系列相关的词语,一个主题包含了若干个出现概率较高的词语。这些词语和这个主题有很强的相关性,这些词语共同定义了这个主题。对于一段话来说,有些词语可以出自这个主题,有些可能来自那个主题,比如一个文章如果涉及到“百度”这个主题,那么“中文搜索”、“baidu”、“搜索引擎”等词语就会以较高的频率出现,而如果涉及到“谷歌”这个主题,那么“英文搜索”、“google”、“搜索引擎”等就会出现的很频繁。而搜索引擎这个词同时都存在于百度和谷歌这2个主题。

搜索引擎对于文档的语义关联判断是相对的,在对2个文档对比时会对文档信息进行概括性分析,若2个文档对应的主题相当,那肯定是比较有关联的。语义关联判断是需要对比的,比如你搜索“苹果”搜索引擎就无法判断你要的水果还是手机,只会根据大部分人的一个搜索需求给出结果,单一一个包含于多个主题的词搜索引擎无法判断你需要的主题,只有根据你的长期搜索习惯来判定,所以需要加一个修饰,搜索“苹果手机”、“苹果和三星哪个好”,这样搜索引擎就能准确给出你需要的主题。

语义关联分析对关键词排名起到‘支撑“作用

搜索引擎收录页面之后,发现一些关键词出现在一起的次数很多,可以形成一个共同的话题,从而把这些词归纳为语义相关的词。当这些语义相关性的词出现在一起形成一个话题的时候,对页面的核心关键词的相关性起到增强的作用,排名也会得到提升。  

很空洞?木木seo来举个例子,如果你搜索“选举”,搜索引擎可能会获取包含“投票”,“竞选”和“选票”的文本信息,但是“选举”这个词有可能出现很少或根本没有出现在这些信息来源中,也就是说语义搜索可以对关键词的相关词和类似词进行解读,从而扩大搜索内容信息与用户搜索词的准确性和相关性,提高核心关键词的排名,这比单一一个词带来的相关性要强的多。比如你要写一篇关于苹果手机的文章,如果在文章里全部加入苹果这个词,效果肯定不如再适当插入iphone、手机、乔布斯等词的效果好。

同时从SEO关键词角度来说,还可以扩大网页标题与内容的相关性,内容中加入和标题关键词主题关联度高的词可以让标题和网页内容的相关性得到加强。所以在写文章的时候除了适当插入核心关键词之外还可以加入与这个主题相关或相似的词来使结果与用户搜索词更相关。

综上所述,语义主题关联判断是一个能够挖掘语言背后隐含信息的利器,同时我们也可以根据搜索引擎的语义关联判断来服务于网站的优化和推广。不要排斥搜索引擎,努力的接近它,认识它,了解它,我们才可以更好的利用它,搜索引擎的规则就在那里,利用不利用就看你的认识有多深。

时间: 2024-08-02 10:14:04

搜索引擎如何进行语义分析的相关文章

多方位剖析搜索引擎排名

各位SEO朋友,接触SEO这么久,也看了不少达人们写的文章,也有很多专业性很强的文章,也有很多实用性的内容.其中大家一直关注并为这个问题烦恼,也是在为这个问题不断的寻找答案,那就是搜索引擎排名的问题,咋们做优化先抛开营销不说,都是在追求高的排名和流量,这个也是做优化的根本目的,各位seoer也是为了达到这个目的想了很多的办法,可谓是不折手段.通过这半年的时间我也对此做了简单的积累和总结.下面就一一分享给大家. 首先我想说的最核心的三点是一个领域的网站的相关度.重要度和权威度.可能这核心的三点大家

浅析网站营销与标题之间的关系

如果说一个网站的成功取决于内容质量,那么好的标题无异于点睛之笔.对于普通用户而言,在不知情的时候多半通过搜索引擎检索网站,而呈现在用户面前的首先就是网站的标题.所以,懂得搜索引擎营销之人,不只会通过竞价提升排名,而且懂得如何通过富有创意的广告标题猎取用户的注意力.毕竟,在用户尚未打开任何一个网站之前,注意力就是营销力,就可以获得更多的营销机会.网站标题的重要性当然不止于此,从网站优化的角度而言,适度植入关键词可以事半功倍的提升网站排名.所以,看似不起眼的几个单词组合,巧妙运用就是字字珠玑. 一.

《SEO的艺术(原书第2版)》——2.3 确定搜索者意图并交付相关、新鲜的内容

2.3 确定搜索者意图并交付相关.新鲜的内容 现代商业搜索引擎依赖信息检索(Information Retrieval,IR)科学.这门学科从20世纪中叶就已经存在,当时的检索系统配备在图书馆.研究设施和政府实验室等机构的电脑系统上.搜索系统开发的早期,IR科学家意识到大部分搜索功能都由两个关键部分组成:相关性和重要性(在本章前面已经定义).为了度量这些因素,搜索引擎进行文档分析(包括跨文档概念的语义分析)和链接(或引用)分析.2.3.1 文档分析和语义联系 在文档分析(document ana

站长浅谈:网站优化多年的心得体会

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 一.title的写法: 1. 网站采用独一无二的TITLE,这样比较容易收录和排名文章也尽量采用独一无二的TITLE,当然里面包含关键字.说明下,只所以要用独一无二的TITLE,就是因为搜索引擎喜欢原创,如果你的TITLE是它数据库里没有的,那它会很喜欢收录,毕竟做有一个站收录是大问题,排名是小问题,好解决,这个是个人的观点.呵呵呵. 2.

网站标题关乎营销再思考

摘要: 如果说一个网站的成功取决于内容质量,那么好的标题无异于点睛之笔.对于普通用户而言,在不知情的时候多半通过搜索引擎检索网站,而呈现在用户面前的首先就是网站的标题.所 如果说一个网站的成功取决于内容质量,那么好的标题无异于点睛之笔.对于普通用户而言,在不知情的时候多半通过搜索引擎检索网站,而呈现在用户面前的首先就是网站的标题.所以,懂得搜索引擎营销之人,不只会通过竞价提升排名,而且懂得如何通过富有创意的广告标题猎取用户的注意力.毕竟,在用户尚未打开任何一个网站之前,注意力就是营销力,就可以获

成败就在字词间 网站标题关乎营销再思考

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 如果说一个网站的成功取决于内容质量,那么好的标题无异于点睛之笔.对于普通用户而言,在不知情的时候多半通过搜索引擎检索网站,而呈现在用户面前的首先就是网站的标题.所以,懂得搜索引擎营销之人,不只会通过竞价提升排名,而且懂得如何通过富有创意的广告标题猎取用户的注意力.毕竟,在用户尚未打开任何一个网站之前,注意力就是营销力,就可以获得更多的营销机会

浅谈如何带来高质量的外部链接

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 外部链接建设在SEO中是非常重要的一个环节.当大家的站内优化做得差不多的时候,比拼的就是谁的外链质量高并且数量多了.而外链质量和外链数量相比,外链质量显得更重要.一个高质量外链往往胜过几十个.几百个甚至上千个低质量外链.那么什么样的外链才是高质量外链呢?下面SEO探究和实践者谢来恩向大家剖析高质量外链的两大因素: 一.来自高权重页面的外链 ·

如何让百度青睐你的网站

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp; 1.URL的命名规则 大部分网站的URL命名规则是"根域名+栏目+文章页面",也有一部分网站的URL命名规则是"根域名+文章页面",其中能够产生变数的多半在于文章页面的命名规则上,有很多的朋友可能会注意到自己的命名规则是不太合理的,那么什么样的URL命名规则比较利于搜索引擎抓取呢?下面看看谷歌在<创建方便 Google

搜索引擎如何判断关键词与页面相关度

关注电商圈的朋友肯定会发现排在百度前2名的2个参赛博客已经稳定名次一个周多了,反观其他参赛网站,排名变化是此起彼伏.祁多多博客自从决定参加电商圈大赛以来,也一直在关注这个关键词的排名情况,并且发现很多新站都是首次获得比较好的排名. 祁多多就想搜索引擎是怎么判断网站页面是做的什么关键词的?简单的讲就是关键词和网站页面的相关性程度,相关性好自然会有排名甚至排名很好,相关性不好,可能就排名差点甚至没有排名.在查阅了一些相关资料,并且和群里的朋友讨论了一番后,觉得站在搜索引擎的角度上,应从以下几方面来看