百度分词理论之标题的设计实例解析(上篇)

  影响一个页面在搜索引擎排名最重要的因素之一是相关度,而最直接体现一个页面与用户搜索行为是否相关的就是标题,那么想写好一个标题你就不能不去深入的了解搜索引擎的分词原理!以百度为例,经过十年左右的完善,在中文搜索里百度已经是一个非常高效的搜索引擎,大家也和点水一样肯定都知道一个高效的搜索引擎工作肯定会涉及到很多为人知的技术点,但我们如果把复杂的搜索引擎工作简化为三个步骤那么分别是:查询,分词,匹配。那我们通过实例来看看搜索引擎是如何处理的呢,为了能理解的更加直观,我们以水手(年轻时很喜欢这首歌)为主关健词在百度进行实验。

  一 搜索引擎如何处理查询

  1,搜索引擎的被动行为。

  如果用户根据自已的意愿在搜索的关健词的时候有加上空格,标点,那么搜索引擎会优化按用户的行为进行查询,这个应该很好理解!例如:百度搜索 郑智化水手 与搜索 郑智化 水手,所返回的结果会是不一样的!可能这个例子还并不直观,举一个更直观的例子,分别搜索:郑智化 学 和 郑智 化学。搜索结果分别如下图:


 

  看上图就很直观了,搜索引擎会优化考虑用户的查询行为。

  2,搜索引擎的主动行为

  搜索引擎收到用户的搜索内容,会根据自已基础词典与特殊词库为用户的查询进行主动分词,如搜索:郑智化水手 ,百度会根据其搜索词库(猜测为:人名库+歌名库)智能将郑智化与水手这两个词分别进行查询,搜索结果如:


  那么如果搜索内容中包含同时中文与英文百度是如何处理的呢?百度会将英文做为单独的一块来处理,然后英文前后的词也做为一个单独的块。试搜索:郑智化bt下载,结果如下:

  


 

  二,搜索引擎如何进行分词与匹配

  分词根据字符串进行匹配,最常见的有三种分词匹配法,分别为:正向最大匹配法,反向最大匹配法和最短路径分词法。

  1,什么是正向最大匹配法呢?

  简单点说就是从左到右进行分词,例如百度:武林外传说,武林外传与传说是两个不同的词,根据用户搜索习惯与词库分析百度会返回一个正向最大的匹配,也就是分词为:武林外传 说。搜索结果如下图:


  2,什么是反向最大匹配法

  反向分词固名思义就是从右向左进行分词了。回到刚才的例子,百度:郑智化学,如果按照正向分词那么我们应该得到的分词结果是:郑智化 学。那么百度搜索的结果为什么却不是这样呢?而是分成了郑智 化学。如图:


  这就是因为百度搜索结果中是用了反向分词进行匹配!

  3,正反向同时分词匹配

  而有一种特殊的情况,就是关健词前后组合内容被认为粘性相差不大,而搜索结果辊也同时包含这两组词的话,百度会进行正反向同时进行分词匹配,如搜索关健词:北京华烟云,返回结果如下:

  


 

  4,什么是分词最少化

  指:分出来的词数应该是追求最少化,以搜索:武林外传说 为例,理论可以分成:武林 外 传说,可是百度只分成了 武林外传 说 ,即能尽量将分组数减少,能分成两组的尽量不分成三组!

  只有对搜索的分词技术基础原理进一步了解之后才能知已知彼,有针对性的为网站首页,内页设计标题,从而更好的布局长尾词,让流量最大化。文章原创于:点水的博客 地址:http://www.cuihonghai.com/

  那么理解了搜索引擎的这些分词原理后如何合理利用进行标题设计呢?如何让行业网站长尾词策略的作用得到充分发挥?让流量倍增?点水在下一篇将进一步通过实例来详述行业网站如何进行标题设计和长尾词布局的方法!

时间: 2024-08-22 15:20:30

百度分词理论之标题的设计实例解析(上篇)的相关文章

巧用百度分词技术实例分析博客多个关键词的排名

武汉SEO混小子最近每天忙着做饭啊做饭.被做饭折腾的够呛,手上还有很多网站需要维护,所以博客一直不接单子做,找的人倒是挺多的,昨天就有一位广州的人加我QQ,咨询了下网站的事情,他也是位初入SEO的朋友,老板交给他一个网站,要在首页做8个关键词,因为每个关键词有的长有的短,结合起整体,就感觉非常长,或许效果不是很好,就来问到我,其实这样的问题我在以前也纠结过,不过还好,慢慢的使用实例就解决掉了,合理的运用百度分词技术可以达到这个目的,今天这篇文章就实例分析下我的这个博客,让新手朋友直观的了解下百度

案例分析如何通过百度分词技术来写网站标题描述

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 其实作为一个网络推广的小卒子,网站优化尤其重要,尤其是如今百度独挡一面的政策下,基于百度的网站优化尤为重要,百度的关键词排名,在网站优化中是最终的目的,谈到关键词了,有很多的刚介入网站优化的朋友,还不知道怎么去确定网站的标题,描述和关键词,所以今天打算简单讲解一下.我所讲,也是经验之谈,所以请借鉴使用!本人不承担任何责任.其实如果是企业的话,

利用百度分词技术轻松获得精准流量

我们在做SEO优化过程中,该怎样利用好百度分词技术,提高关键词与用户之间搜索匹配度度,从而轻松获得精准的转化率高的流量.比如笔者目前做的关键词"时尚袜子",用户在搜索"时尚袜子"和"去哪里找时尚袜子"这两个词,出来的自然排名结果完全不同.特别是在优化网站长尾关键词时,加大关键词与用户搜索的匹配度,就非常关键. 通常情况下我们利用百度分词技术把匹配度分成三种:完全匹配.高度匹配.模糊匹配.我们在确定使用哪个关键词之前,需要多了解用户的搜索习惯,今天

百度分词算法详解第1/2页_网站运营

本文通过搜索结果归纳分析+切词通用算法分析的方式对百度预处理阶段的查询处理和中文分词两项技术进行了阐述.总结,如果你对数据结构.算法有一定了解的话,理解起来会相对容易些:个人感觉,得出正向最大匹配算法不够准确,无论是专用词典还是普通词典里的词,都是有不同权重的,这根搜索频率应该有一定关系,基于这点,在出现多个专用词典里的词时,是需要采用双向最大匹配算法来检测到底哪一个专有词汇应该先被切出来,当然,这是个人猜想,有待考究. 理解分词技术对SEO工作具有极大意义,可以从科学的角度来分析关键词,并构想

虚子雨:百度分词技术研究与猜测

百度搜索引擎在中文领域市场占有率第一的地位,严格来说是他有了一套非常好的分词技术.当然高深的分词技术我们是无法探知的.但我们可以从一些表面的一些"管"来窥其里面的"豹".今天杭州SEO就为大家谈一谈关于百度分词的一点点基本的猜测. 首先我们要了解百度分词的条件,并不是所有的词都会有分词产生,例如我们搜索"大学生",返回的结果,我们会看到精准匹配,那么百度就对这个词没有进行了分词处理,看下图:   而我们搜索"电影下载",百度就

一组走心又走肾的优质电商网站设计实例(下)

  目前国内的几家大型的电商平台越做越完善,大有集众家之所长于一身的趋势.反观国外的这些优质的电商网站 ,大多有自己的风格和不同于他人的设计方向.这些个性和坚持让这些网站显得越发的独一无二了.也正是在这样的设定之下催生了各不相同的设计策略和技巧,而这些正是我们需要重新思考.深入学习的地方.另外,本文的上半部分在此:<潮流酷站!一组走心又走肾的优质电商网站设计实例(上)> 21. 提供多级侧边栏 相比于传统的顶部多级导航栏,侧边栏会让页面显得更加整齐易用.Carolina Herrera 的侧边

站长们一定要清楚的百度分词技术

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 百度自称是全球最大中文搜索引擎,最了解国内网民的搜索习惯,做为中国搜索引擎的老大,很多草根站长一直在研究的它的搜索技术和排名算法,还有不少站长兄弟姐姐还要靠它的流量吃饭,为此1781.html">草根网站的站长们对它是又爱又恨,百度能带来很大的流量,又会无情的K站或降权. 好的,那咱们说说百度的分词技术,可能小弟有说的不对地方

百度快照不显示标题和描述的原因和详细解决办法

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 很多站长应该碰到过百度快照不显示标题和描述的情况,就是明明搜索关键词能搜索到,可百度的搜索结果中却没有显示网站标题和描述,只显示网址在那里.关于这种现象百度官方已经给了如下解释. lee:原因比较复杂,需要针对性分析.主要原因可能是tag title提取失败,系统只好从其他地方取了一些文本作为标题.这种提取失败的原因,有网页设计层面的(比如全

做网站要主要的百度分词技术_网站应用

百度自称是全球最大中文搜索引擎,最了解国内网民的搜索习惯,做为中国搜索引擎的老大,很多草根站长一直在研究的它的搜索技术和排名算法,还有不少站长兄弟姐姐还要靠它的流量吃饭,为此草根网站的站长们对它是又爱又恨,百度能带来很大的流量,又会无情的K站或降权.   好的,那咱们说说百度的分词技术,可能小弟有说的不对地方,请大家拍砖头,希望大家共同进步.没有研究百度分词前不明白百度为什么比google强大.其实分词也就是切词,百度是否拿来一句中文字符串拿来随便切一下呢,当然不会.那么怎么才满足被切割的条件呢