Solr中配置IKAnalyzer分词器配置,测试分词效果

来源:互联网 发布:java float int 比较 编辑:程序博客网 时间:2024/04/28 06:44

1:下载IKAnalyzer2012_u6.zip,解压缩至F:\software\Lucence\IKAnalyzer2012_u6,简写为IKAnalyzer_home


2:将IKAnalyzer_home中的IKAnalyzer2012_u6.jar拷贝至tomat_home\webapps\solr\WEB-INF\lib


3:在tomat_home/solr/conf/schema.xml中,加入IKAnalyzer分词器配置信息

        <!-- IKAnalyzer分词器 -->
        <fieldType name="text_ik" class="solr.TextField">
                <analyzer type="index">
                        <tokenizer  class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="false" /> 
                                <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" /> 
                                <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" /> 
                                <filter class="solr.LowerCaseFilterFactory" /> 
                </analyzer>
                <analyzer type="query">
                        <tokenizer  class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="true" /> 
                        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" /> 
                        <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" /> 
                        <filter class="solr.LowerCaseFilterFactory" /> 
                </analyzer>
        </fieldType>


4:测试中文分词效果http://localhost:8081/solr/admin/analysis.jsp


原创粉丝点击