为solr添加中文分词器
来源:互联网 发布:慢走丝编程软件 编辑:程序博客网 时间:2024/05/17 23:06
上一篇文章介绍了怎么在windows系统中配置solr,下面为solrt添加中文分词器
下载
由于中文分词器的jar包官网已经不再发布,可以从maven 库中下载
maven 中下载的jar包不知道是不适合solr4.7.2还是配置方式不对,一直没有配置成功。后来自己从csdn上下载和mmseg4j-1.9.1后配置成功。
中文分词器的jar包 百度云下载地址 http://pan.baidu.com/s/1jGpFBPs配置
1.将下载好的mmseg4j-1.9.1的jar包放到tomcat下的webapps\lsolr\WEB-INF\lib下面
注: 这个版本的mmseg4j-analysis-1.9.1.jar有bug需要从这里http://pan.baidu.com/s/1pJHpK2B后替换掉原有的jar包- 修改solr\home\collection1\conf下的schema.xml
在 标签内加入
- 修改solr\home\collection1\conf下的schema.xml
<fieldType name="text_mmseg4j_complex" class="solr.TextField" positionIncrementGap="100" > <analyzer> <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/> </analyzer> </fieldType> <fieldType name="text_mmseg4j_maxword" class="solr.TextField" positionIncrementGap="100" > <analyzer> <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" dicPath="dic"/> </analyzer> </fieldType> <fieldType name="text_mmseg4j_simple" class="solr.TextField" positionIncrementGap="100" > <analyzer> <!-- <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="n:/OpenSource/apache-solr-1.3.0/example/solr/my_dic"/> --> <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="dic"/> </analyzer> </fieldType>
其中 text_mmseg4j_complex 就是中文分词器的名字如果想让那个field使用中文分词器可以这个做
在标签中有许多子标签例如
<field name="title" type="text_general" indexed="true" stored="true" multiValued="true"/>
把type=”text_general”改为type=”text_mmseg4j_complex”后这个field就会使用中文分词器
0 0
- 为solr添加中文分词器
- (搜索引擎之solr) 给solr添加中文分词器
- Solr-----4、Solr添加IK中文分词器
- Solr学习(二)为Solr加入中文分词器
- Solr 中文分词器
- solr 中文分词器
- Solr与tomcat整合,并添加中文分词器
- Solr与tomcat整合,并添加中文分词器
- Solr与tomcat整合,并添加中文分词器
- 为Elasticsearch添加中文分词,对比分词器效果
- 为 Elasticsearch 添加中文分词,对比分词器效果
- 为Elasticsearch添加中文分词,对比分词器效果
- 为Elasticsearch添加中文分词,对比分词器效果
- Solr配置文件 ----- 添加中文分词IKAnalyzer
- 三、为solr配置mmseg4j中文分词
- solr配置中文分词器
- solr 中文分词器配置
- solr配置中文分词器
- 【leetcode】 Best Time to Buy and Sell Stock II
- Apache 限速模块安装笔
- 你因挣钱而伟大
- CocoaPods Guide
- 读HTML5应用与开发实践【二】【验证表单】
- 为solr添加中文分词器
- 电脑问题处理:关闭windows7 特效以减少内存占用
- QHeaderView 禁用某些列排序和添加QCheckBox控件
- 设计模式 笔记 命令模式 Command
- Weblogic在安装成功之后,本机可以访问,其他机器不可以访问的解决方案
- Ubuntu常用操作
- 编写C#程序 1-23
- 第八周 项目2-Time类中的运算符
- php正则表达式简明介绍