nutch solr系列之(三)solr 4.8.1 支持中文分词
来源:互联网 发布:淘宝买家怎么买运费险 编辑:程序博客网 时间:2024/04/23 17:36
1、将solr 4.8.1中solr-4.8.1\contrib\analysis-extras\lucene-libs下的lucene-analyzers-smartcn-4.8.1.jar包拷贝到tomcat的solr部署文件夹的lib目录(tomcat-8.5.9\webapps\solr\WEB-INF\lib)下
2、修改tomcat中solr的配置文件schema.xml(tomcat-8.5.9\solr\collection1\conf目录下)
2.1 在types节点中添加如下内容:
<fieldType name="text_smart" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<!-- 此处需要配置主要的分词类 -->
<tokenizer class="solr.SmartChineseSentenceTokenizerFactory"/>
<!--
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
<filter class="solr.LowerCaseFilterFactory"/>
-->
<!-- in this example, we will only use synonyms at query time
<filter class="solr.SynonymFilterFactory" synonyms="index_synonyms.txt" ignoreCase="true" expand="false"/>
-->
<filter class="solr.SmartChineseWordTokenFilterFactory"/>
</analyzer>
<analyzer type="query">
<!-- 此处配置同上 -->
<tokenizer class="solr.SmartChineseSentenceTokenizerFactory"/>
<!--
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
<filter class="solr.LowerCaseFilterFactory"/>
-->
<filter class="solr.SmartChineseWordTokenFilterFactory"/>
</analyzer>
</fieldType>
2.2 在fields节点中添加如下内容:
<field name="name_ik" type="text_smart" indexed="true" stored="true" multiValued="false" />
其中field的type的值就是引用上面fieldType 的name值。
3、访问solr进行验证
阅读全文
0 0
- nutch solr系列之(三)solr 4.8.1 支持中文分词
- Solr之中文分词
- Solr笔记三之Solr加入中文分词
- nutch solr系列之(二)nutch命令分析
- nutch solr系列之(一)win7下安装nutch solr
- [Nutch]Solr配置自定义的中文分词器mmseg4j
- solr cloud系列-IK中文分词器
- (三)solr的dataimport的配置以及中文分词
- 三、为solr配置mmseg4j中文分词
- (搜索引擎之solr) 给solr添加中文分词器
- solr中文分词
- solr+mmseg4j 中文分词
- solr中文分词(mmseg4j)
- Solr 中文分词器
- solr+mmseg4j 中文分词
- solr中文分词
- solr+mmseg4j 中文分词
- Solr 使用中文分词
- 百钱买百鸡
- 构造函数与 new 命令
- C语言中的二级指针和二维数组问题
- Java代码获取oracle存储过程返回值
- Codeforces-873B:Balanced Substring(DP)
- nutch solr系列之(三)solr 4.8.1 支持中文分词
- c#实验解答(9)
- iOS APP内购功能实现研究资料
- 【1701H1】【穆晨】【171018】连续第八天总结
- c#实验解答(10)
- Qt开发====>五子棋游戏
- 萌新的看毛片(kmp)学习日记(下标从0开始)
- 为了c币
- 为了c币