IKAnalyzer 扩展分词库

来源:互联网 发布:牛贝 微信淘宝客 7.01 编辑:程序博客网 时间:2024/05/16 01:17

在solr中加入自己的扩展分词库方法:

参考文章:

http://www.cnblogs.com/dennisit/archive/2013/04/07/3005847.html 

 

1、在solr的web中:\WEB-INF目录下新增一个文件夹:classes

 

2、新增一个文件:IKAnalyzer.cfg.xml

复制代码
<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">  <properties>      <comment>IK Analyzer 扩展配置</comment>    <!--用户可以在这里配置自己的扩展字典-->    <entry key="ext_dict">my.dic;</entry>         <!--用户可以在这里配置自己的扩展停止词字典-->    <entry key="ext_stopwords">stopword.dic;</entry>     </properties>
复制代码

说明:

my.dic即为扩展分词库,分词库可以为多个,以分号隔开即可。停止词库一样。

 

3、新增my.dic文件。文件格式必需是:无BOM的UTF-8格式,示例内容为:

西丽

 

4、保存,重启solr。

使用了新的分词,需要重新建索引数据。

 

5、测试:

分类: [solr]
0 0