solr4.5配置ik分词器

来源:互联网 发布:王自如 知乎 编辑:程序博客网 时间:2024/06/06 03:37

一、关于solr的安装与配置请参见:http://blog.csdn.net/xintongfei/article/details/18003003

二、ik分词的下载地址:

1.https://code.google.com/p/ik-analyzer/downloads/list(IKAnalyzer2012FF_h1.zip)

2.http://download.csdn.net/download/bitree3078/6461647(csdn下载地址)

三、在solr4.5中配置ik分词

1.将下载的压缩包解压,达到如下目录:

我们需要使用其中的(IKAnalyzer.cfg.xml、IKAnalyzer2012FF_u1.jar、stopword.dic)。

IKAnalyzer.xml为配置文件,stopword.dic为屏蔽词词库。

2.将上述三个文件复制到%Tomcat_Home%\webapps\solr\WEB-INF\下,我在其下建立了一个classes文件夹将IKAnalyzer.xml与stopword.dic放入其中。将IKAnalyzer2012FF_ul.jar放到%Tomcat_Home%\webapps\solr\WEB-INF\lib\下。(有人将三个文件全部放入lib中)

3.设置IK分词器在schema.xml文件中的配置

(schema.xml目录位置在 ...\solr\collection1\conf“)

在<type>.........</type>中间添加如下内容:

<!-- ChineseIK -->    <fieldType name="text_ik" class="solr.TextField">       <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>       <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>    </fieldType>

其中isMaxWordLength表示是否按照最大匹配分词。索引时,使用默认的最细粒度分词。查询时使用最大匹配分词。

该版本不支持positionIncrementGap设置。

至此ik分词配置完毕。

四、测试

首先修改“schema.xml”中的name字段:


修改为:<field name="name" type="text_ik" indexed="true" stored="true" />

修改完成后启动tomcat访问:http://localhost:8080/solr/#/collection1/analysis


关于如何扩展用户自定义的分词词典和屏蔽词词典请参见:

http://linliangyi2007.iteye.com/blog/429960

0 0