IKAnalyzer在Solr下扩充词典
来源:互联网 发布:手机编程百度专用皮肤 编辑:程序博客网 时间:2024/05/21 17:40
首先确定的是IKAnalyzer是否能在Solr下正常运行,若不能正常运行,请参考文章Solr & IKAnalyzer 配置。
现在假设IKAnalyzer已经配置好,并且你现在的情况是IK自带的词典无法满足你的分词要求,那么我们就需要添加自己的词库。假设你有一个自己的词库叫ext.dic文件,你想要IK结合你自己的词典进行分词需要进行如下操作:
1.将你的字典拷贝到tomcat/webapps/solr/WEB_INF/classes中。在classes文件夹有你之前拷贝的IKAnalyzer.cfg.xml文件,打开该文件。
2.在这里配置你的ext.dic文件的相对路径,因为我们已经将其放入到classes文件中了,因此相对路径就是ext.dic。
<entry key="ext_dict">ext.dic;</entry>
3.配置成功,在接下来的分词中就会结合ext.dic进行分词。
那么如何自己建立自己的词库呢?现在目前处于测试阶段,就直接找到一个dic文件在里面手动添加词汇。等到实际需要建立词库时再来写一篇吧。
0 0
- IKAnalyzer在Solr下扩充词典
- IKAnalyzer词典扩充
- IKAnalyzer 扩展词典(强制分词)【solr里添加扩展词典,扩展词典的格式必须是 utf-8 的无BOM格式编码。jav开发中 IKAnalyzer.cfg.xml必须在类路径根下】
- solr下配置IKAnalyzer分词器的扩展词典,停止词词典
- Lucene-IKAnalyzer(中文分词)基于配置的词典扩充
- Lucene—IKAnalyzer分词器配置扩充词典
- solr下配置IKAnalyzer同义词
- lucene配置IKanalyzer词典
- IKAnalyzer 配置扩展词典
- Apache Solr 4.9 和 IKAnalyzer中文分词配置(下)
- solr 4.4 安装IKAnalyzer
- solr 4.9配置IKAnalyzer
- Solr & IKAnalyzer 配置
- [solr] - IKAnalyzer 分词加入
- [solr] - IKAnalyzer 分词加入
- IKAnalyzer词典占用内存大小分析
- 中文分词器扩充中文词库IKAnalyzer
- Solr中文分词配置(IKAnalyzer)
- 关于团队模式开发问题
- 数据结构第二章
- 关键帧动画CAKeyframeAnimation
- ios中模拟手势单击或是双击
- 批量删除代码注释
- IKAnalyzer在Solr下扩充词典
- 黑马程序员-----网络编程
- Android之自定义控件
- ExtJs的数据代理proxy
- 特殊字符及其引用和转义
- JDK中的设计模式
- Tomcat 配置虚拟主机
- 集算器JDBC的集成与使用方法
- ctags 的一些实用细节!!