Solr6+中文分词(mmseg4j)
来源:互联网 发布:菜刀三国杀淘宝 编辑:程序博客网 时间:2024/06/04 06:22
在搭建Solr服务器的基础上(http://blog.csdn.net/u010379996/article/details/51790743)
1. 下载mmseg4j包和字典(.dic)
2. 搭建mmseg4j中文分词
在Solr_Home创建dic文件夹,并把mmseg4j的.dic文件复制到此
下载mmseg4j-solr-2.3.0.jar, mmseg4j-core-1.10.0.jar,并复制到Solr项目的lib中
修改managed-schema(config目录)文件
添加: <fieldType name="textComplex" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic文件夹的绝对路径"/>
</analyzer>
</fieldType>
<fieldType name="textMaxWord" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" dicPath="dic文件夹的绝对路径"/>
</analyzer>
</fieldType>
<fieldType name="textSimple" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="dic文件夹的绝对路径"/>
</analyzer>
</fieldType>
- Solr6+中文分词(mmseg4j)
- Solr6.0.1配置中文分词器mmseg4j
- solr+mmseg4j 中文分词
- solr中文分词(mmseg4j)
- solr+mmseg4j 中文分词
- solr+mmseg4j 中文分词
- solr中文分词(mmseg4j)
- 添加中文分词(mmseg4j)
- Lucene中文分词mmseg4j
- solr6.5.1中文分词
- Solr6配置中文分词库mmseg4j
- Solr6自定义mmseg4j中文分词库,升级mmseg4j
- 中文分词 mmseg4j-1.8框架
- solr中文分词(mmseg4j) 编辑
- solr4.4.0+mmseg4j 中文分词
- solr5.5.3 集成mmseg4j 中文分词(二)
- Solr6.1配置中文分词
- solr中集成中文分词 mmseg4j
- iOS开发中的一些常用方法
- Android 圆角fraagment的实现
- 实现杂记(27):解决在onCreate()过程中获取View的width和Height为0的4种方法
- linux curl参数详解
- java_小小五子棋小游戏
- Solr6+中文分词(mmseg4j)
- Linux的常用命令
- oracle11g创建表
- Hibenate异常汇总:java.lang.NoClassDefFoundError: org/jboss/
- Android MTK 设置默认启动 Launcher
- 日语单词记忆法
- 版本更新
- shell 模拟curl
- java多线程--“锁”总览