solr-4.10.0、tomcat7、IKAnalyzer2012FF_u1中文分词器相整合以及相关配置

来源:互联网 发布:蜂王浆胶囊 知乎 编辑:程序博客网 时间:2024/06/05 21:17

solr-4.10.0与tomcat7整合相关配置:

1、在本机创建文件夹目录如图:



2、solr中的example文件下solr文件里的所有信息拷贝到要作为服务器的位置D:\solrconfig\solr\home文件下



3、复制solr-4.10.0\example\webapps中的solr.war文件到tomcat安装目录中的webapps文件夹下,运行tomcat,(忽略怎么运行tomcat),tomcat会自动解压solr.war文件,删除solr.war文件。(不然每次启动tomcat都会发布一次)



4、将解压出来的solr文件夹拷贝到自己创建的D:\solrconfig\solr\server文件下



5、修改D:\solrconfig\solr\home\collection1\conf文件下的solrconfig.xml里的data 索引数据存储位置为<dataDir>${solr.data.dir:D:\solrconfig\solr\home\collection1\data}</dataDir>




6、tomcat\conf\server.xml配置文件下的<Host></Host>节点配置solr主目录位置

 <Context path="/solr"docBase="D:\solrconfig\solr\server\solr" debug="0" crossContext="true" reloadale="false">

  <Environment name="solr/home" type="java.lang.String" value="D:\solrconfig\solr\home" override="true"></Environment>

</Context>


7、如果启动tomcat报一下的错,缺少jar



8、将解压出来的\solr-4.10.0\example\lib\ext下的所有jar拷贝到tomcat的lib文件下,重新启动tomcat


9、通过http://localhost:8080/solr/进行访问



=============IK Analyzer 2012FF_hf1中文分词配置=============

1、将IKAnalyzer2012FF_u1.jar导入 盘符:\solr\server\solr\WEB-INF\lib中

(并且要有commons-io-2.3.jar,commons-logging-1.1.1.jar两个jar)



2、将IKAnalyzer.cfg.xml、stopword.dic拷贝到需要使用分词器的core的conf(盘符:\solr\server\solr\WEB-INF\classes)下面(注意:如果没有classe文件夹自己创建一个classes文件夹,方便配置自己的定义的词库)

3、在 盘符:\solr\home\collection1\conf\schema.xml中配置以下配置
<fieldType name="text_ik" class="solr.TextField">   

       <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>  


       <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>  


</fieldType>


=============IK Analyzer 2012FF_hf1配置自定义词库=============


1、修改 盘符:\solr\server\solr\WEB-INF\classes文件夹的IKAnalyzer.cfg.xml配置文件如下 将自己定义的词库文件放入 盘符:\solr\server\solr\WEB-INF\classes下和IKAnalyzer.cfg.xml在一个目录中

(注意:ext.dic的编码必须是Encode in UTF-8 without BOM,否则自定义的词库不会被识别如果想配置多个自定义词库,可以<entry key="ext_dict">ext.dic;mydic.dic</entry>用分号(;)隔开 )


<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">  
<properties>  
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict">ext.dic;</entry> 

<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords">stopword.dic;</entry> 
</properties>


 

1 0
原创粉丝点击