4 Lucene笔记(四):第三方分词器IKAnalyzer

来源:互联网 发布:爱淘宝推广链接 编辑:程序博客网 时间:2024/06/06 16:43
使用第三方IKAnalyzer分词器--------中文首选
步一:导入IKAnalyzer分词器核心jar包,IKAnalyzer3.2.0Stable.jar
步二:将IKAnalyzer.cfg.xmlstopword.dicxxx.dic文件复制到MyEclipsesrc目录下,再进行配置,在配置时,首行需要一个空行
IKAnalyzer.cfg.xml需要放在src目录下,stopword.dicxxx.dic 可以放在src下自己创建的目录中,多个文件时以“;”分隔


IKAnalyzer.cfg.xml配置文件

<?xmlversion="1.0"encoding="UTF-8"?>
<!DOCTYPEpropertiesSYSTEM "http://java.sun.com/dtd/properties.dtd"> 
<properties> 
     <comment>IK Analyzer 扩展配置</comment>
     <!--用户可以在这里配置自己的扩展字典 -->
     <entrykey="ext_dict">/mydict.dic; /mypack/mydict2.dic ; /commycompany/dic /mydict3.dic ;</entry>
     
     <!--用户可以在这里配置自己的扩展停止词字典 -->
     <entrykey="ext_stopwords">/ext_stopword.dic</entry>   
</properties>



0 0
原创粉丝点击