SOLR3.x配置mmseg4j分词器

来源:互联网 发布:高圆圆长相知乎 编辑:程序博客网 时间:2024/04/28 14:15


1.下载mmseg4j的压缩包,如果不能翻墙下载,请到百度上搜索下载,以下为google的官网链接:

wget http://mmseg4j.googlecode.com/files/mmseg4j-x.x.x.zip

2.解压包并移动JAR包到指定位置

unzip mmseg4j-x.x.x.zip -d  mmseg4j-x.x.x

将mmseg4j-x.x.x/mmseg4j-all-x.x.x-with-dic.jar复制到solr下的lib目录

3.配置相关文件

将schema.xml文件中所有的
  <tokenizerclass="solr.WhitespaceTokenizerFactory"/>
  和
  <tokenizer class="solr.StandardTokenizerFactory"/>
  替换为
  <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory"mode="complex"/>


0 0
原创粉丝点击