配置solr使其支持中文检索
来源:互联网 发布:stc90c52rc单片机容量 编辑:程序博客网 时间:2024/05/01 02:02
默认情况下 Apache Solr 是不支持中文检索的,如果文档中包含中文,必须用完整的一句中文才能检索出内容。
下面以 Apache Solr 的演示程序为例,注意:粗体部分是需要修改的地方。
找到如下三行:
<fieldType name="text" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
修改为:
<fieldType name="text" class="solr.TextField">
<analyzer type="index" class="org.apache.lucene.analysis.cjk.CJKAnalyzer">
<tokenizer class="org.apache.lucene.analysis.cjk.CJKTokenizer"/>
找到如下两行:
<analyzer type="query">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
修改为:
<analyzer type="query" class="org.apache.lucene.analysis.cjk.CJKAnalyzer">
<tokenizer class="org.apache.lucene.analysis.cjk.CJKTokenizer"/>
修改完毕,重新运行 Apache Solr 就可以对中文进行检索了,原先已经导入的文档需要重新导入。
记住原先的配置中有个 positionIncrementGap="100" 一定要删除了,否则会有异常。
- 配置solr使其支持中文检索
- solr中文同义词检索的配置讲解
- solr中文全文检索
- Solr检索配置
- 修改tomcat使其支持中文
- RedHat使其终端支持中文
- 你不知道的全文检索---solr安装中文分词器及配置业务字段
- solr全文检索服务器与tomact整合 IK Analyzer 2012FF_hf1 中文分词器的配置
- solr为什么检索不出中文文档
- 配置php使其支持段标记<? ?>
- solr配置中文分词
- solr-中文分词配置
- solr 配置中文分词
- solr配置中文分析器
- 修改ReadMorePlugin.java,使其支持中文标题(roller webblog)
- 修改(python) mysql 数据库 使其可以支持插入中文
- 【solr】Solr中文分词配置(IKAnalyzer)
- 配置Solr中文分词器IK以及ansj,支持动态修改用户词库。
- Java中接口的编写与实现
- org.quartz.plugins.xml.JobInitializationPlugin] [ERROR] - Error scheduling jobs: no protocol
- Java中内部类的编写
- 指向类的成员的指针
- J2EE项目在LINUX环境下的部署:二、F-Secure SSH Client的使用
- 配置solr使其支持中文检索
- 经验从哪里来?从痛苦中来
- datagridview列表导出到EXCEL方法
- global-forwards的作用
- oracle有continue的用法
- Oracle 数据库 10g系列产品
- 潜规则:公司招聘中不能说的秘密,简历只有这么发才有希望!
- UNIX网络编程卷2进程间通信读书笔记(三)—有名管道 (1)
- 关于powerdesiner的用法