方便Lucene高版本使用IKAnalyzer分词

why

IKAnalyzer是个很不错的中文分词工具,但已经不维护了,但只支持低版本的Lucene,为了兼容Lucene6.x版本,这里是小改动了一些然后放到github上,方便有需要的人使用。

也对Lucene源码比较熟,后面有必要再自己重新写个分词工具。

changes

  • Lucene的Analyzer抽象类有变。
  • Lucene的Tokenizer抽象类有变。
  • Lucene的BooleanQuery有变。
  • Lucene的QueryParser有变。

link

https://github.com/sea-boat/IKAnalyzer-Mirror

how to use

<dependency>
  <groupId>com.seaboat</groupId>
  <artifactId>IKAnalyzer</artifactId>
  <version>7.4.0</version>
</dependency>

====广告时间,可直接跳过====

鄙人的新书《Tomcat内核设计剖析》已经在京东预售了,有需要的朋友可以到 https://item.jd.com/12185360.html 进行预定。感谢各位朋友。

=========================

欢迎关注:

时间: 2024-08-03 20:50:46

方便Lucene高版本使用IKAnalyzer分词的相关文章

Lucene5学习之使用IKAnalyzer分词器

   之前的示例中,使用的是默认的StandardAnalyzer分词器,不能有效的进行中文分词,下面演示下如何在Lucene5.0中使用IKAnalyzer分词器.     首先下载IKAnalyzer分词器源码,IKAnalyzer分词器源码托管在OSChina的git上.下载地址: http://git.oschina.net/wltea/IK-Analyzer-2012FF 请如图下载IK的源代码:    然后打开Eclipse新建一个Java Project:      然后解压下载下

高版本VS发布时预编译可能导致Mono中Razor找不到视图

早前一段时间,一位朋友在Q群里面找到我,说它按照<Linux.NET学习手记>的操作,把一个ASP.NET MVC 4.0的项目部署到Mono之后出现Razor无法找到视图的现象.当时费了一番周章才把问题解决.而最近一段时间,群里也有其他的朋友出现相同的问题,随着时间的推移,想必会有越来越多朋友会使用高版本的VS,于是我把当时的情况重现出来,并把解决办法记录下来. 像往常一样,我们创建了一个MVC4的项目. 然后添加了一个视图,默认的那个(/Home/Index),然后,再发布到Linux.N

多系统安装实战:从高版本到低版本安装系统

现在市场上主流的品牌机随机安装的操作系统一般为Windows XP,但是,部分用户可能仍然对Windows 98.Windows ME或Windows 2000等操作系统情有独钟,希望能在不破坏原操作系统的前提下,再安装一下以上操作系统.按常规来说,如不使用第三方的软件,我们在安装微软的Windows系列操作系统时,应该按照从低版本到高版本的顺序来依次安装:如果使用第三方的软件,又会涉及到所使用的软件的版权及用法问题,对一般用户来说显然是不太合适的.其实,按我们在本文提供的方法,不使用第三方的任

office2003怎么升级到office更高版本

office2003怎么升级到office更高版本   office office2003升级到office更高版本的方法: 首先,先把电脑里的office2003的所有组件都卸载了,具体步骤如下: 1.首先我们点击电脑的左下角的"开始",然后在点击"控制面板"; 2.在新弹出的窗口里点击"卸载程序"; 3.找到officeSYSTEM,右键它,然后点击"卸载"; 4.找到有office字眼的程序; 5.都右键,然后点击&qu

word提示&quot;由较高版本的microsoft word创建&quot;怎么办?

  word提示"由较高版本的microsoft word创建"怎么办?          步骤如下: 1.首先点下载:word2003兼容2007兼容包; 2.下载完成后在FileFormatConverters文件上单击右键,选择[解压到FileFormatConverters]将其解压; 3.打开FileFormatConverters文件夹,双击打开FileFormatConverters.exe ,勾选左下角"单击此处接受<Microsoft 软件许可条款&g

在电脑中如何将高版本的AutoCAD文件保存为低版本格式

  在电脑中如何将高版本的AutoCAD文件保存为低版本格式         方法一: 1.打开文件后点击左上角的"文件"--"另存为"; 2.在弹出"图形另存为"对话框中,设置文件名,然后点击"文件类型"下拉框,从中选择低版本的cad文件保存格式,点击保存即可. 方法二: 1.打开CAD后,点击菜单栏中的"工具"--"选项"; 2.或者直接在命令中输入"OP",并按

Excel高版本自动保存Excel2003低版本方法

  在excel办公软件的使用过程中,不少还在使用excel2003版本的,而多数已经升级到2007或是2010版本的,在excel2007或2010版本默认的保存也是2007或是2010版本的,这些版本如果发给excel2003用户的话,他们是无法打开的,当然在Excel2007或是2010在保存时可以选择另存为,在另存为中选择低版本,但是这样一来就比较麻烦每次这样保存是很麻烦的,本文就说一下在Excel2007及Excel2010软件中的excel高版本自动保存为低版本方法. 适用范围:Ex

XP打不开word提示“由较高版本的microsoft word创建”怎么办

XP打不开word提示"由较高版本的microsoft word创建"怎么办  步骤如下: 1.首先点击下载:word2003兼容2007兼容包; 2.下载完成后在FileFormatConverters文件上单击右键,选择[解压到FileFormatConverters]将其解压; 3.打开FileFormatConverters文件夹,双击打开FileFormatConverters.exe ,勾选左下角"单击此处接受<Microsoft 软件许可条款>&qu

高版本的office怎么设置文件默认保存为低版本?

  如何设置高版本的OFFIC默认保存为低版本,让低版本的office也可以打开你的文档,版本问题导致文档打不开是一个比较麻烦的问题.为此,特写本帖为高版本office的朋友们解决这个问题: 步骤一:打开word 如图: 点击文件,选项,如图 设置默认方式为word97- 2003文档.doc,确定.如图 excel 2013 2010和ppt的设置方法也是如此.