浅谈中文分词匹配与完全匹配之优劣

  刚刚度过每周4的百度小更新,笔者的网站的排名掉了不少下去。而好友刘敏华的个人博客却迅速的占位在我前面。为什么今天要写这样的文章呢,因好友的网站最近一直没有有更新,且快照更新的很延迟。而恰恰相反笔者的网站是每日的更新,且快照也很长长,为什么会产生这样的问题呢。后来笔者就拿这个去请教朱卫坤老师。言谈之中涉及到了两个知识点 中文分词匹配 完全匹配

  


 

  中文分词匹配又分为字符串匹配分词,理解分词方法,统计分词方法。最常用的为字符串匹配,在字符串匹配中又细分为正向最大匹配法,逆向最大匹配法,最少切分,双向最大匹配法。具体的内容大家参考下百度百科,或者笔者的个人博客里面有详细的讲解。

  完全匹配,从字面上就可以很深入的理解。是一摸一样的,如搜索笔者的名字“李金龙” 那么在百度首页出现的肯定是“李金龙”这个名字连在一起的,而不是“李xxxxx金xxx龙”

  今天的主要问题是分析中文分词匹配与完全匹配的差异。如上面的扼要,好友的网站通过完全匹配超越笔者的网站,那么他为什么会超越呢?请往下看

  完全匹配天生比中文分词匹配对于排名有优势吗?

  答案是肯定的,比方说搜索“早上吃什么”很明显的看到排在前面的是完全匹配的,而我们再往下面看看,不断的出现了飘红的字眼已经不再是“早上吃什么”,出现了更多“早上吃啥”“吃什么”“早上都吃什么”那么这么大家或许也就明白了其意义

  或许有人会问,在首页也有不是完全匹配的啊,那么这里我举个例子 同样的一个帖子发往不同的地方,可以看下他们的排名位置,那你是否会认为他们可以并排在一起位置上呢。很显然不可能,百度也有其计算的方法,如各类工具中提到的百度权重。你是否认为权重1 可以跟权重6的相比较 ,很显然是不可能的。

  完全匹配一定比中文分词匹配好吗?

  答案是否定的,世界万物没有绝对的好,同样完全匹配也是这样。再举个例子一个网站的标题是这么写的

  “今天我要吃什么东西,今天我要买什么衣服,今天我要看什么电影,今天我要听什么歌曲,今天我要看什么书...XX网”

  “今天我要吃什么东西_买什么衣服_看什么电影_听什么歌曲_看什么书...XX网”

  针对上面的举例,我想更多的人更偏爱下面这个标题。至于为什么,我想因为读起来更通顺吧!抛开其他一切的不说,网站的标题给人浏览的时间是不同的,而对于记忆成本也是有所差距的,正如一个企业的品牌网站,如果你的网站的名称很长很长,我想你的品牌在一定程度上是比较难做的。而在百度的优化指南明确的提出了,一切以用户体验为主。所以这里想要表达的就是你想做的是什么,然后再决定你该做什么。

  粗略的介绍了这么两点,其实总结出来也就是 想要流量那么你去做完全匹配,想要品牌那么就用中文分词的匹配,在此也谢谢朱卫坤老师的辛苦讲解。

  转载请注明淮安网站建设http://www.ljlseo.com/tg/401.html 

时间: 2024-09-05 21:11:52

浅谈中文分词匹配与完全匹配之优劣的相关文章

浅谈中文分词

字典匹配 最简单的分词就是基于字典匹配,一个句子"浅谈中文分词",如果字典中我有这三个词"浅谈""中文""分词"那么我自然就可以把句子进行分词了.基于字典匹配随之而来的问题就是有多个匹配的情况,比如有"北京""北京大学"两个词,这时来了个句子"北京大学在哪里",应该用"北京"去匹配还是用"北京大学"去匹配,于是人们提出了很多启发

浅谈百度分词与关键词匹配度的优化方法

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 百度分词技术一直是一门学问.对于搜索词,百度会不会进行分词,怎么分词,会影响到我们确立目标关键词及关键词排名优化的效果.掌握好分析技术,可以提高关键词语搜索词的匹配度,从而提高网站的排名,获得精准的流量.对于百度分词,我们需要了解百度是怎么分词,以及如何利用好分词技术来选择目标关键词. 百度是如何进行分词的 对于搜索词,首先要判断百度会不会进

SWJ小谈:中文分词的作用与概述-说教篇!

中介交易 SEO诊断 淘宝客 云主机 技术大厅 大家好依旧是我上海SEO(SWJ) ,前段时间一直有网友问我 关于分词方面的内容,特别是中文分词再百度中的使用,前端时间SWJ写过2篇关于分词技术的文章 如果你没看过 我推荐你看下. 这2篇分别是: 1.<什么是中文分词?对SEO优化有什么帮助?> http://www.seo-sh.cn/seo/196.html 2. <在seo的应用中与分词之间的作用!>http://www.seo-sh.cn/zhishi/jishu/103.

浅谈中文文本自动纠错在影视剧搜索中应用与Java实现

1.背景: 这周由于项目需要对搜索框中输入的错误影片名进行校正处理,以提升搜索命中率和用户体验,研究了一下中文文本自动纠错(专业点讲是校对,proofread),并初步实现了该功能,特此记录. 2.简介: 中文输入错误的校对与更正是指在输入不常见或者错误文字时系统提示文字有误,最简单的例子就是在word里打字时会有红色下划线提示.实现该功能目前主要有两大思路: (1)  基于大量字典的分词法:主要是将待分析的汉字串与一个很大的"机器词典"中的词条进行匹配,若在词典中找到则匹配成功:该方

【BABY夜谈大数据】浅谈中英文分词

前言 <BABY大数据>已经和豆瓣签约并会在豆瓣上连载哦,欢迎大家都豆瓣上订阅.本章之后将会在豆瓣上收费,博客上仍然提供免费阅读,我自己也是在开源社区下成长起来的就当做回馈开源社区吧!如果你喜欢本书或者想要支持我,可以直接在豆瓣购买哦!https://read.douban.com/column/3346397/ 因为有朋友反馈说看懂了算法但不知道怎么用,所以简单地说下自己的写作计划吧,<BABY夜读大数据>会从基础的一些概念讲解然后逐渐到应用.实际案例.预计30章左右,每一到两周

站长浅谈中文网站SEO

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 我是广告,修改我在后台最近经常光顾了下searchenginewatch和blackhatworld.不由得感慨,中文SEO领域依然年轻气盛. 1.不尊重前者 以前看到一篇博文说中国互联网公司不懂什么叫权威,说的是中国互联网公司不懂得尊重经验和权威人士,其实中文SEO领域更是如此.人们喜欢把一些前辈的理念帖认为是废话,就如学生时代认为老师反复

浅谈中文域名的发展趋势及前景

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 记得最早一次看见中文米用在实体上是在沈阳一家烤翅店,黑色的底板上映出鲜亮的红色域名,翅客.com.当时没太在意,只是觉得中文米真有人用而略略感慨.没想到回鞍山以后,又发现好多商家企业都用中文后缀的米,一佰伴.cn.干洗店.泡菜等等各种行业都有用中文米的现象. 2009年3月1日,墨西哥第34届ICANN年会全体会议上,ICANN组织决议通过中

浅谈中文域名正规化的技术瓶颈

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 近期万网又开始抄作中文域名,随着宣传,很多人开始投资中文域名.哪么中文域名到底价值几何.在未来发展中,中文域名以发挥什么作用呢?本文我用事实和大家分析分析中文域名还存在一些问题做个探讨. 首先我们先来重新认识下域名.域名作来网站入口标识,是网站最重的资本.当世界的网站越来越多,域名下的页面被搜索引擎收录越多,排名越好,网站的流量就多,这是不争

浅谈百度中文分词是如何进行的

相信大家对于搜索引擎收录的分词技术一直都很好奇,掌握了解了搜索引擎分词技术对于我们这些站长的工作有很大的帮助:在网站的链接架构及关键词的布局都与分词有很大的关系.平时跟百度接触的比较多,所以就以百度中文分词为例介绍下搜索引擎分词的方法. 中文分词是什么 在了解百度的中文分词之前大家首先要了解什么是中文分词?我们中文与英文不同,是由一个个汉字连接成的,因此分起来相对比较复杂.百度的中文分词是将一个汉语句子切分成一个个的单独的词,然后按照一定的规则重新组合成一个序列的过程,简称"中文切词"