Solr4.10.3中整合中文分词mmseg4j-1.9.1
来源:互联网 发布:java redis视频教程 编辑:程序博客网 时间:2024/04/28 06:17
下载兼容Solr4.10.3的中文分词器mmseg4j-1.9.1
http://download.csdn.net/detail/hugofgh/8395743
解压,
提取其中的三个文件:mmseg4j-analysis-1.9.2-SNAPSHOT.jar, mmseg4j-core-1.9.1.jar,mmseg4j-solr-1.9.2-SNAPSHOT.jar。
放到目录:L:\service\tomcat8\webapps\solr\WEB-INF\lib
修改配置文件schema.xml,添加下面的两段代码:
fieldType:
<pre name="code" class="html"><!-- mmseg4j--><fieldType name="text_mmseg4j_complex" class="solr.TextField" positionIncrementGap="100" > <analyzer> <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/> </analyzer> </fieldType> <fieldType name="text_mmseg4j_maxword" class="solr.TextField" positionIncrementGap="100" > <analyzer> <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" dicPath="dic"/> </analyzer> </fieldType> <fieldType name="text_mmseg4j_simple" class="solr.TextField" positionIncrementGap="100" > <analyzer> <!-- <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="n:/OpenSource/apache-solr-1.3.0/example/solr/my_dic"/> --> <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="dic"/> </analyzer> </fieldType><!-- mmseg4j-->
与fieldType对应的field:
<pre name="code" class="html"><!-- mmseg4j --><field name="mmseg4j_complex_name" type="text_mmseg4j_complex" indexed="true" stored="true"/><field name="mmseg4j_maxword_name" type="text_mmseg4j_maxword" indexed="true" stored="true"/><field name="mmseg4j_simple_name" type="text_mmseg4j_simple" indexed="true" stored="true"/><!--mmseg4j -->
此时就算配置完成了,重启tomcat服务.即可
进入即可测试
http://localhost:8080/solr/#/collection1/analysis
0 0
- Solr4.10.3中整合中文分词mmseg4j-1.9.1
- Solr4.7.0中整合中文分词mmseg4j-1.9.1
- solr学习(二)Solr4.7.2中整合中文分词mmseg4j-1.9.1
- solr4.4整合mmseg4j-1.9中文分词器
- solr4.4.0+mmseg4j 中文分词
- solr4.5配置中文分词器mmseg4j
- solr4.5配置中文分词器mmseg4j
- solr4.5配置中文分词器mmseg4j
- solr与mmseg4j整合详细步骤(solr4.7.1和mmseg4j-1.9.1)
- solr4.10+tomcat7+mmseg4j中文分词搭建过程
- solr4.5部署到tomcat以及solr4.5配置中文分词器mmseg4j
- solr中集成中文分词 mmseg4j
- solr+mmseg4j 中文分词
- solr中文分词(mmseg4j)
- solr+mmseg4j 中文分词
- solr+mmseg4j 中文分词
- solr中文分词(mmseg4j)
- 添加中文分词(mmseg4j)
- 设计模式之Decorator(装饰者)
- APB_PWM模块DUT&Testbench实践
- C/S学习总结
- Scrum印记之糟糕的回顾会
- touch事件的分发和消费机制
- Solr4.10.3中整合中文分词mmseg4j-1.9.1
- 阿里云 安装docker
- 蓝桥杯 基础练习 十六进制转八进制
- 3秒钟解决“/”应用程序中的服务器错误
- [Android]Fragment加载替换add,show,hide,replace方法
- 实习篇---千里难寻的是朋友
- 2015年1月25号到31号日志
- 锚点的简单使用
- java复制文件FileInputStream BufferedFileInputStream Paths Files