solr添加IKAnalyzer分词器
来源:互联网 发布:最基本的网络通信协议 编辑:程序博客网 时间:2024/04/30 09:34
最近在学习solr时候,碰到一个问题,就是如果采用默认的分词器,会将每个字都分割成一个词组进行索引
比如:长沙市 会被分词为 “长”,“沙”,“市”,这样就达不到我想要的效果
例如:
<field name="name" type="text_general" indexed="true" stored="true"/>
这个是默认的分词器
<fieldType name="text_general" class="solr.TextField" positionIncrementGap="100"> <analyzer type="index"> <tokenizer class="solr.StandardTokenizerFactory"/> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" /> <!-- in this example, we will only use synonyms at query time <filter class="solr.SynonymFilterFactory" synonyms="index_synonyms.txt" ignoreCase="true" expand="false"/> --> <filter class="solr.LowerCaseFilterFactory"/> </analyzer> <analyzer type="query"> <tokenizer class="solr.StandardTokenizerFactory"/> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" /> <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/> <filter class="solr.LowerCaseFilterFactory"/> </analyzer> </fieldType>我对城市名称进行索引
结果:
对每个字都进行了分词
所以这里我们需要手动加入分词功能,我这里采用的IKAnalyzer,这里分词,会进行词组分词 “长沙”,“市” 这样
在schema.xml文件中加入
<fieldType name="text_ik" class="solr.TextField"> <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/> </fieldType>
<field name="name" type="text_ik" indexed="true" stored="true"/>
然后重启
这样效果就达到了,这里和lucene的差不多滴!
0 0
- solr添加IKAnalyzer分词器
- Solr 添加 IKAnalyzer分词器
- Solr配置文件 ----- 添加中文分词IKAnalyzer
- Apache Solr 增加IKAnalyzer分词器
- solr的IKAnalyzer中文分词器配置
- 5、solr配置中文分词器(IKAnalyzer)
- Solr之IKAnalyzer中文分词器-yellowcong
- [solr] - IKAnalyzer 分词加入
- [solr] - IKAnalyzer 分词加入
- 安装中文分词器。solr集成ikanalyzer分词器
- Solr中配置IKAnalyzer分词器配置,测试分词效果
- Solr中文分词配置(IKAnalyzer)
- Solr中文分词配置(IKAnalyzer)
- Solr4.6添加IKAnalyzer分词器
- Solr中文分词器配置讲解 (IKAnalyzer和mmseg4j)
- Windows上基于solr配置IK(IKAnalyzer)分词器方法
- 【solr】Solr中文分词配置(IKAnalyzer)
- solr添加IK分词器
- 常见面试之机器学习算法思想简单梳理
- HDU 1003Max Sum
- 用while随机求十个数的和
- HDU 1506Largest Rectangle in a Histogram
- UVA 11991Easy Problem from Rujia Liu?
- solr添加IKAnalyzer分词器
- UVA 11995I Can Guess the Data Structure!
- LA 3135 - Argus
- 栈,队列,优先队列的使用
- 链队列的综合操作(详解、演示)C语言实现
- Redis主从备份以及key的过期时间配置
- vector的用法
- 后缀表达式+栈的应用=四则表达式运算
- 单链表的实现