solr添加IKAnalyzer分词器

来源:互联网 发布:最基本的网络通信协议 编辑:程序博客网 时间:2024/04/30 09:34

最近在学习solr时候,碰到一个问题,就是如果采用默认的分词器,会将每个字都分割成一个词组进行索引

比如:长沙市  会被分词为   “长”,“沙”,“市”,这样就达不到我想要的效果

    例如:

        

  <field name="name" type="text_general" indexed="true" stored="true"/>

   这个是默认的分词器

    

 <fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">      <analyzer type="index">        <tokenizer class="solr.StandardTokenizerFactory"/>        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />        <!-- in this example, we will only use synonyms at query time        <filter class="solr.SynonymFilterFactory" synonyms="index_synonyms.txt" ignoreCase="true" expand="false"/>        -->        <filter class="solr.LowerCaseFilterFactory"/>      </analyzer>        <analyzer type="query">        <tokenizer class="solr.StandardTokenizerFactory"/>        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />        <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>        <filter class="solr.LowerCaseFilterFactory"/>      </analyzer>    </fieldType>
    我对城市名称进行索引

    结果:

    


      对每个字都进行了分词

  所以这里我们需要手动加入分词功能,我这里采用的IKAnalyzer,这里分词,会进行词组分词      “长沙”,“市”  这样

      在schema.xml文件中加入   

    <fieldType name="text_ik" class="solr.TextField">               <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>         </fieldType>  
   
 <field name="name" type="text_ik" indexed="true" stored="true"/>

然后重启

   
   

   这样效果就达到了,这里和lucene的差不多滴!




0 0
原创粉丝点击