Lucene中如何使用庖丁Paoding Analyzer分词器

来源:互联网 发布:html单页源码 编辑:程序博客网 时间:2024/04/30 02:02
【背景】给Lucene添加分词器,一般直接将分词器的jar包引入到项目就可以。但如果按照同样的方法给Lucene添加Paoding analysis,在运行时却老抛类似于java.lang.NoClassDefFoundError: net/paoding/analysis/analyzer/PaodingAnalyzer的异常。

【原因】庖丁分词器Paoding Analyzer在使用前必须引入庖丁词库,而我们就刚好缺少了这一步。

【解决】

1.下载paoding-analysis的压缩包后解压,下面以paoding-analysis-2.0.4-beta为例;

2.拷贝paoding-analysis-2.0.4-beta\src\paoding-dic-home.properties文件到项目src下,并在其里面添加一句:

paoding.dic.home=F:\\paoding-analysis\\dic(字典路径,自己换);

3.最后除了要引入paoding-analysis.jar外,记得还要引入paoding-analysis-2.0.4-beta\lib下的所有jar包,还有这些jar包的路径一定不能含有中文,否则还会抛出NoFileFoundException异常!

这样,我们就可以在Lucene中使用庖丁分词器了。

0 0
原创粉丝点击