Solr6+中文分词(mmseg4j)

来源:互联网 发布:菜刀三国杀淘宝 编辑:程序博客网 时间:2024/06/04 06:22

在搭建Solr服务器的基础上(http://blog.csdn.net/u010379996/article/details/51790743)

1. 下载mmseg4j包和字典(.dic)

2.  搭建mmseg4j中文分词

在Solr_Home创建dic文件夹,并把mmseg4j的.dic文件复制到此

下载mmseg4j-solr-2.3.0.jar, mmseg4j-core-1.10.0.jar,并复制到Solr项目的lib中

修改managed-schema(config目录)文件
添加:     <fieldType name="textComplex" class="solr.TextField" positionIncrementGap="100">
   <analyzer>
     <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic文件夹的绝对路径"/>
   </analyzer>
 </fieldType>
 <fieldType name="textMaxWord" class="solr.TextField" positionIncrementGap="100">
   <analyzer>
     <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" dicPath="dic文件夹的绝对路径"/>
   </analyzer>
 </fieldType>
 <fieldType name="textSimple" class="solr.TextField" positionIncrementGap="100">
   <analyzer>
     <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="dic文件夹的绝对路径"/>
   </analyzer>
 </fieldType
>


0 0