Solr4 + Jcseg(分词器) 安装配置--源自技术

来源:互联网 发布:淘宝天猫超市优惠券 编辑:程序博客网 时间:2024/06/01 08:06

环境部署

这里我安装的是Solr4.6和jcseg1.9.2

下载地址(网上可以搜索到)

安装solr:


1.solr安装解压后,将\solr-4.6.0\dist目录下的solr-4.6.0.war 更名为solr.war,然后放到tomcat的webapps下;
2.将\solr-4.6.0\example目录下的solr目录拷贝到tomcat子目录中;
3.在tomcat中conf\Catalina\localhost目录下添加solr.xml文件:
[html] view plain copy 在CODE上查看代码片派生到我的代码片
  1. <?xml version="1.0" encoding="UTF-8"?>  
  2.   
  3. <Context docBase="D:/solr/tomcat/webapps/solr" debug="0" crossContext="true" >  
  4.    <Environment name="solr/home" type="java.lang.String" value="D:/solr/tomcat/solr" override="true" />  
  5. </Context>  

启动Tomcat后,访问:http://localhost:8080/solr/

配置中文分词Jcseg:

1.修改\tomcat\solr\collection1\conf目录下的schema.xml文件,添加如下代码:
[html] view plain copy 在CODE上查看代码片派生到我的代码片
  1. <fieldtype name="textComplex" class="solr.TextField">  
  2.     <analyzer>  
  3.         <tokenizer class="org.lionsoul.jcseg.solr.JcsegTokenizerFactory" mode="complex"/>  
  4.     </analyzer>  
  5. </fieldtype>  
  6.   
  7. <fieldtype name="textSimple" class="solr.TextField">  
  8.     <analyzer>  
  9.         <tokenizer class="org.lionsoul.jcseg.solr.JcsegTokenizerFactory" mode="simple"/>  
  10.     </analyzer>  
  11. </fieldtype>  

2.将jar包添加到tomcat/webapps/solr/WEB-INFO/lib目录中
这里添加的jar包包括:
jcseg目录中:jcseg-core-1.9.2.jar, jcseg-solr-1.9.2.jar
solr-4.6.0\dist\solrj-lib目录中:所有jar

3.将jcseg词库添加到tomcat/webapps/solr/WEB-INFO/lib目录中
将jcseg目录中lexicon目录拷贝

测试

打开http://localhost:8080/solr/#/collection1/analysis
输入搜索词:四川省发生了地震,选择fieldType,看结果



0 0
原创粉丝点击