solr下配置IKAnalyzer分词器的扩展词典,停止词词典
来源:互联网 发布:js获取被选中的option 编辑:程序博客网 时间:2024/05/01 05:40
1:将IKAnalyzer_home文件夹下的stopword.dic和IKAnalyzer.cfg.xml复制到tomcat_home/webapps/solr/WEB-INF/classes下,并修改IKAnalyzer.cfg.xml
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict">ext.dic;</entry>
<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords">stopword.dic;</entry>
</properties>
2:修改stopword.dic,在最后加入如下三行
国
中华
中华人民
配置停用词词典后的运行结果对比如下:
3:在tomcat_home/webapps/solr/WEB-INF/classes下新建ext.dic文件,编辑如下
程隆
程隆腾达
4:注意修改文件stopword.dic,ext.dic的编码方式为无BOM的UTF-8编码方式
- solr下配置IKAnalyzer分词器的扩展词典,停止词词典
- IKAnalyzer 配置扩展词典
- IKAnalyzer 扩展词典(强制分词)【solr里添加扩展词典,扩展词典的格式必须是 utf-8 的无BOM格式编码。jav开发中 IKAnalyzer.cfg.xml必须在类路径根下】
- IKAnalyzer 扩展词典(强制分词)
- Lucene-IKAnalyzer(中文分词)基于配置的词典扩充
- solr配置扩展词典和停用词典的问题
- Lucene—IKAnalyzer分词器配置扩充词典
- IKAnalyzer在Solr下扩充词典
- IKAnalyzer 独立使用 配置扩展词典
- IKAnalyzer 独立使用 配置扩展词典
- lucene配置IKanalyzer词典
- solr的IKAnalyzer中文分词器配置
- solr之使用IKAnalyzer配置同义词,停止词,扩展词。
- Paoding分词-扩展词典
- Paoding分词-扩展词典
- IKAnalyzer使用停用词词典进行分词
- solr suggest 词典配置
- 5、solr配置中文分词器(IKAnalyzer)
- C++学习笔记【转】
- C# 中的默认命名空间的范围 (LINQ to XML)
- android power_manager 电源管理分析
- 模块化设计与积木
- MooTools下的返回顶部功能的实现实例页面
- solr下配置IKAnalyzer分词器的扩展词典,停止词词典
- Java中Comparable和Comparator实现对象比较
- IPHONE开发切图比例
- JAVA沙箱安全总结
- DropDownList 用法的一些学习总结
- 基于大型网站的技术分析
- ThinkPHP学习笔记(二)入口文件的作用、URL控制、模板的简单使用方式
- JDBC连接自定义sqlserver数据库实例名(多个实例)
- 64位服务器无法使用access,数据库连接字符串修改