Php实现自动获取关键词的分析

现在的CMS都自带了采集功能,内容和标题相对来说很好处理,但大部分情况关键词很难能提取到。于是自动获取关键字成为当前PHP类CMS的“传统问题”。那如何才能自动获取关键词呢,其主要步骤主要可以分为如下三个步骤:

1,通过分词算法将标题和内容分别进行分割,提取出关键词和频度在内容的分词阶段,当前主要的两个算法是中科院的ICTCLAS和隐马尔可夫模型。但这两个都太高端,有一定的门槛,且都是只支持C++/JAVA。基于PHP的当前有两个是值得推荐的PSCWS和HTTPCWS。 SCWS于2008-03-08发布1.0.0 正式版,到现在最新版本已经到了1.0.4。PSCWS是它的PHP版。而HTTPCWS是张宴开发的,之前叫PHPCWS。PHPCWS 先使用“ICTCLAS 3.0 共享版中文分词算法”的API进行初次分词处理,再使用自行编写的“逆向最大匹配算法”对分词和进行词语合并处理,并增加标点符号过滤功能,得出分词结果。目前仅支持Linux/Unix系统。

 2,将提取结果与现有词库进行比较,得到最符合规则的关键词这里主要就是要看词库了,我们可以自己定义词库,也可以使用现有的成熟词库。

 3,然后将这两套关键词进行比较,得到最符合当前内容的关键词在这个阶段就是具体情况具体分析了。当前PHP类CMS都自有自己的提取关键词系统。其中在网络上流传最广的是DEDECMS的分词源码,我也在我的POPCMS上作过测试,效果很不错,不过类似“我们”等无意义的词提取并被列为关键词的频率太高,甚至有时候还会把空格的HTML提出来做为关键词,亟待改进。不过如果作为辅助功能,它已经很好了。另外PHPCMS和DISCUZ的自动提取关键词功能也很强大。

时间: 2024-10-30 05:06:38

Php实现自动获取关键词的分析的相关文章

PHP中文分词 自动获取关键词介绍_php实例

复制代码 代码如下: <?php header("Content-Type:text/html; charset=utf-8"); define('APP_ROOT', str_replace('\\', '/', dirname(__FILE__))); $test = '这里是一段中文测试代码!'; function get_tags_arr($title) { require(APP_ROOT.'/pscws4.class.php'); $pscws = new PSCWS

实战分析如何实现标题前面自动添加关键词显示

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 前几天偶然搜索某关键词发现谷歌搜索引擎中,对于某些网站会在网站原有的标题后面添加一个关键词,如:标题+关键词来显示.其实这种现象在百度里面就有,很早以前就已经发现了,就是关键词自动匹配添加至标题上来显示.大家可以在百度搜索"友情链接",显示如何 而地址是百度的首页地址,很明显百度的首页不论是标题还是关键词.描述或者内容都不

ASP如何自动获取标题关键词

比如输入标题为:Anycall L768手机客制化的问题. 那么,我们如何通过ASP获取上面的文字的关键词:手机 Anycall 分享阿里西西在制作网站项目中解决些问题的经验心得: 1.建立词库:我们不可能像百度或GG大型搜索引擎那样建立一个大而全的词库,但你可以针对所在的行业关键词进行初始化一个词库数据表,比如把三星,Anycall,诺基亚等这些专业词汇录入到词库数据表里.2.自动获取:在用ASP添加文章操作时,进行匹配词库表里词组,如果标题包含有三星,Anycall这样的关键字时,就可以实现

浅谈竞争性关键词的分析获取以及优化方法

做网站优化的站长都知道,在实际操作过程中,我们会遇到很多竞争性相当强的关键词,虽然难度大,但是我们一旦做到了这些,获取的流量可是相当巨大的.再者说SEO这个行业我们不可能一直做竞争性小的关键词,一方面不能锻炼我们的能力,另一方面实用价值也比较小,所以竞争性关键词是我们不得不接触做的一个方面.不过优化竞争性关键词也不是大家想象中的那样,刀光剑影,成功率极低,只要掌握一定的步骤,做到理想位置对于我们来说还是有可能的.不过笔者先说一下怎样判断关键词竞争性的大小? 第一种方法: 1.列出你的客户可能使用

残叶:如何对长尾关键词进行分析

长尾关键词为非网站的目标关键词(主关键词),但是却能为网站带来搜索量的关键词,为长尾关键词.网站目标关键词的竞争越来越大,并且对于新站是极难获得权重和获取目标关键词的流量.那么长尾关键词是个不错的选择,能够在短期内为我们积累大量的流量.那么应该怎样来对网站的长尾关键词进行分析呢? 长尾关键为非网站的目标关键词,但是却能为网站带来搜索量.长尾关键词比之目标关键词具有明显的特征,关键词比较长,往往由两个词语或者三个词语组成,甚至是一句短语.这样的关键词流量是非常有限的,但是竞争也是非常小的,所以如果

SEO数据分析技巧一:关键词排名分析

大家好,我是虚子雨.SEO作为一个非常基础的营销方法,却又能运用到各个营销手段里面,其中一个非常重要的工作就是SEO的数据分析,因为只有对于SEO推广的工作效果进行定期分析,找出造成不佳效果的原因,总结达到最佳效果的经验,我们才能全局的把握网站SEO流量的来源和价值,才能针对性的调整SEO策略,为我们更好更快的做好网站SEO优化做指导. 对于SEO数据,我们经常关注的有网站页面收录,外链收录,百度谷歌排名,Alex排名,网站流量分析等基础的几个方面,这些方面的数据对于SEO效果分析的帮助不会太大

迅捷fast FW54R路由器无法自动获取IP地址导致上网故障的

  在平常的上网过程中,当遇到路由器的WAN口无法自动获取IP地址的时候,往往可能是关闭了DNCP服务或者是IP地址冲突导致的.下面针对主流的迅捷FW54R路由器来说明这种问题和解决方案: 一.先说说遇到故障的网络情况: 新买的迅捷fast FW54R无线路由器,接上WAN线设置好后,却一直获取不到IP地址导致无法上网. 二.对这个问题的问题分析: 使用很多迅捷fast路由器IP地址解决办法,如改LAN的IP防止冲突.克隆MAC地址,都不能解决问题. 三.针对这个问题的解决方案: (1)查看迅捷

dede自动获取关键字设置详解

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 也是一件老生常谈的事情,我也老怕自己忘记所以在这里记下来,因为很多时候由于其他一些原因,我们在百度的结果正很难找到适合新手操作的教程,因为大部分采集内容在采集的时候已经"变味"了,那新手怎么办,去dede官方论坛?固然研究dede的人很多,但真正你去问的时候就知道了,没多少人搭理,也便很难找到真正适合的教程.所以在自己实践

spring mvc-求助:哪位大神帮我实现下点击修改按钮弹出弹框并且里面自动获取值

问题描述 求助:哪位大神帮我实现下点击修改按钮弹出弹框并且里面自动获取值 我用的是hibernate+springMvc+maven实现的demo想要点击首页列表显示的数据后面的修改按钮可以弹出一个弹框,弹框力量有input文本框 ,弹框出现的时候里面自动有要修改的那一条数据的值页面: <%@ page language=""java"" import=""java.util.*"" contentType="