Linux(CentOS6.4)Solr4.8.1中文分词配置(IK分词)

来源:互联网 发布:c语言字符串转化为数字 编辑:程序博客网 时间:2024/05/21 16:39

1、环境准备

CentOS6.4、Tomcat6.0、Jdk1.7、Solr4.8.1、IK Analyzer 2012FF_hf1

2、配置步骤

(1)下载IK Analyzer分词包,解压缩
(2)将IKAnalyzer2012FF_u1.jar拷贝到solr服务的目录solr/WEB-INF/lib下
cp /usr/download/IK Analyzer 2012FF_hf1/IKAnalyzer2012FF_u1.jar/usr/local/tomcat6/webapps/solr/WEB-INF/lib/
(3)将IKAnalyzer.cfg.xml、stopword.dic拷贝到的conf下面solr/example/solr/collection1/conf目录下(和schemal.xml同一目录)
 (4)修改schema.xml,加入如下配置:
<fieldType name="text_ik" class="solr.TextField"> 
     <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/> 
</fieldType>

如上表示加入"text_ik"类型的分词器(即:IKAnalyzer

最后配置field通过name使用text_ik分词
<field name="text_ik"      type="text_ik"   indexed="true"  stored="true"  multiValued="false" /> 

3、中文分词测试


4、OK搞定!

0 0