让盘古分词支持最新的Lucene.Net 3.0.3

原文:让盘古分词支持最新的Lucene.Net 3.0.3

好多年没升级过的Lucene.Net最近居然升级了,到了3.0.3后接口发生了很大变化,原来好多分词库都不能用了,所以上次我把MMSeg给修改了一下支持了Lucene.Net 3.0.3(参考《基于MMSeg算法的中文分词类库》)。

然后我知道了.Net下还有一个盘古分词(http://pangusegment.codeplex.com/),但也不支持Lucene.Net 3.0.3,网上也不少人在问,于是就下载了它的最新代码,基于Lucene.Net 3.0.3更新了,顺便把它的词库给放到dll里面了,不然每次还要拷贝一个Dictionaries目录真麻烦。另外打包放到了Nuget上,方便下载。

https://github.com/JimLiu/Lucene.Net.Analysis.PanGu

 

另外对比了一下MMSeg和Pangu,发现各有优缺点,没有做特别深入的比较,先用MMSeg好了。

时间: 2024-09-10 19:21:56

让盘古分词支持最新的Lucene.Net 3.0.3的相关文章

传高通骁龙830将支持最新的Quick Charge 4.0

外媒Fudzilla援引一位匿名消息人士的话称,高通骁龙830处理器将会支持最新的Quick Charge 4.0快速充电技术,其最大功率达到了28W.据了解,新的充电器将支持5V/4.7A-5.6A和9V/3A这两种方案. 这意味着高通已经找到了一种方案,能够在不损坏电池的情况下将更多的电量传输到配有骁龙830 处理器的设备电池中,这对于消费者来说是一个相当不错的消息. 事实上,高通采用的是一种被称为"最佳电压智能协商算法"的技术,它能够在任意时刻精确地识别电池需要的充电功率,避免出

Evasi0n7:目前越狱支持最新版本的iOS 7.0.5

[TechWeb报道]苹果前日更新了iOS 7.0.5,虽不是大幅更新,但还是迎来很多用户的担忧,原因就是不知道越狱是否支持该版本.而最近越狱团队Evasi0n7发布消息:iOS用户可以放心的升级系统,因最新的越狱软件还能够支持该系统版本.或许7.0.5已是iOS7.1之前最后一个版本,但该版本升级毫无预兆,更新包也不大,但很多越狱用户不敢升级,目前这个新固件已被推 送到用户的设备上.但可以得知的是目前该版本系统并没封堵越狱漏洞,不过据了解未来的iOS 7.1将封堵这个漏洞,并且变得更难破解.

lucene.net 3.0.3、结合盘古分词进行搜索的小例子(分页功能)

添加:2013-12-25 更新:2013-12-26 新增分页功能. 更新:2013-12-27 新增按分类查询功能,调整索引行新增记录的图片字段. 最新盘古分词dll和词典管理工具下载:http://pangusegment.codeplex.com/ 词典下载:http://pangusegment.codeplex.com/releases/view/47411  //封装类 using System; using System.Collections.Generic; using Sy

求教关于lucene.net盘古分词器的问题

问题描述 我在搜索中加入了盘古分词器之后,用panguanalyzer替代了standardanalyzer,但是建立新的索引之后的搜索貌似是搜索到一个关键词就返回一次结果,所以搜索结果大量重复,求怎么解决....z这是搜索方法的代码,求大神解救.....privatevoidsearch(){DateTimestart=DateTime.Now;//createthesearcher//indexisplacedin"index"subdirectorystringindexDire

盘古分词-Lucen.net搜索的时候,怎么让输入的关键词先显示,然后再显示单个的字

问题描述 Lucen.net搜索的时候,怎么让输入的关键词先显示,然后再显示单个的字 我用lucene.net和盘古分词结合,对txt文档实现了搜索,但搜索结果的排序有问题,比如,我搜索"方法",盘古分词会先对"方法'进行分词,分为"方"."方法'."法",然后搜索结果会把含有"方"和"法"的文档和含有"方法"的文档都显示出来,但是我想把含有"方法"

LuceneNet+盘古分词

问题描述 网站有1000多万数据,全站搜索使用了LuceneNet+盘古分词,网站启动后就自动加载分词文件,但是每个词第一次搜索都要几秒或上十秒以上,第二次后再搜索这个词就只使用几ms就出来了,请问有什么办法让每个词的第一次搜索都能秒显? 解决方案 解决方案二:将加载分词文件后的数据缓存起来,可以吗?解决方案三:写个软件都相关的词都自动查一遍解决方案四:引用1楼hanjun0612的回复: 将加载分词文件后的数据缓存起来,可以吗? 已经做了缓存的,就是网站启动加载后就缓存下来了解决方案五:引用2

10nm工艺骁龙835首现身 同时支持最新快充4.0

17日,高通公司宣布将与三星电子合作开发下一代旗舰级处理器骁龙835,据称835将采用三星最先进的10nm制造工艺.另外,高通表示835将支持最新的快充技术Quick Charge 4.0. 由于采用全新的10纳米制程工艺,高通方面表示骁龙835处理器将具备更低的功耗以及更高性能,从而提升移动设备的用户体验. 据悉,今年10月份,三星就率先公布了10纳米工艺的量产,与上代14纳米工艺相比,10纳米可以减少30%的芯片尺寸,同时提升27%的性能以及降低40%的功耗. 借助10纳米工艺制程,高通骁龙

盘古分词用自定义字典

问题描述 如图.....请问下盘古分词工具怎么设置自定义字典来分词.把自带的分词删掉...添加自己的字典 解决方案 解决方案二:下载字段管理工具,里面有一个dictManager.exe下载地址http://download.csdn.net/detail/fangmenglong12/5298566#comment

盘古分词,记灵一下

http://pangusegment.codeplex.com PanGu.dll 调用方法 初始化 在进程启动时,我们需要对盘古分词进行初始化,初始化的调用代码如下: 默认方式初始化 PanGu.Segment.Init();   这个调用将使用和 PanGu.dll 同路径下的 pangu.xml 配置文件    指定配置文件方式初始化   PanGu.Segment.Init(filename); filename 为pangu.xml 的完整路径名,如"c:\pangu.xml&quo