问题描述
我使用solr服务,分词器为lucene-analyzers-smartcn-4.10.1.jar,配置如下:分词的效果如下:如何使【BRW200/31.5-0101-7】分解为【BRW200、31.5-0101-7】,或者【BRW200、31.5、0101、7】呢?请各位指教,谢谢!
解决方案
解决方案二:
为森么没人回答呢准备用mmseg4j又与Lucene-4.10.1各种不兼容。。。
解决方案三:
自定义分词器:)取巧的方式是在现有的分词器上做wrap,加入自己的逻辑。
解决方案四:
引用2楼deltatang的回复:
自定义分词器:)取巧的方式是在现有的分词器上做wrap,加入自己的逻辑。
用的是HMMChineseTokenizerFactory怎么wrap,完全是Lucene小白啊,能给个代码段吗?
解决方案五:
给不了,木兴趣折腾这东东。。。。-_-breadthefuckingcode...
时间: 2024-12-23 07:39:55