IKAnalyzer 扩展分词库
来源:互联网 发布:牛贝 微信淘宝客 7.01 编辑:程序博客网 时间:2024/05/16 01:17
在solr中加入自己的扩展分词库方法:
参考文章:
http://www.cnblogs.com/dennisit/archive/2013/04/07/3005847.html
1、在solr的web中:\WEB-INF目录下新增一个文件夹:classes
2、新增一个文件:IKAnalyzer.cfg.xml
<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd"> <properties> <comment>IK Analyzer 扩展配置</comment> <!--用户可以在这里配置自己的扩展字典--> <entry key="ext_dict">my.dic;</entry> <!--用户可以在这里配置自己的扩展停止词字典--> <entry key="ext_stopwords">stopword.dic;</entry> </properties>
说明:
my.dic即为扩展分词库,分词库可以为多个,以分号隔开即可。停止词库一样。
3、新增my.dic文件。文件格式必需是:无BOM的UTF-8格式,示例内容为:
西丽
4、保存,重启solr。
使用了新的分词,需要重新建索引数据。
5、测试:
分类: [solr]
0 0
- IKAnalyzer 扩展分词库
- [solr] - IKAnalyzer 扩展分词库
- [solr] - IKAnalyzer 扩展分词库
- IKAnalyzer配置扩展词库经验总结
- Solr6配置中文分词库 IKAnalyzer
- IKAnalyzer 独立使用 配置扩展词库
- IKAnalyzer 独立使用 配置扩展词库
- IKAnalyzer 添加扩展词库和自定义词
- Lucene建立索引 使用IKAnalyzer扩展词库
- Lucene使用IKAnalyzer分词实例 及 IKAnalyzer扩展词库
- Lucene使用IKAnalyzer分词实例 及 IKAnalyzer扩展词库
- Apache Lucene 5.x 集成中文分词库 IKAnalyzer
- Apache Lucene 5.x 集成中文分词库 IKAnalyzer
- solr中添加扩展分词库和停止词库
- 在Solr4.10配置IKAnalyzer 同义词、扩展词库、停顿词详解
- 在Solr4.10配置IKAnalyzer 同义词、扩展词库、停顿词详解
- IKAnalyzer如何自定义远端词库
- IKAnalyzer如何自定义远端词库
- 从海量数据中查找数据
- 使用XIB自定义一个UIView,然后将这个view添加到controller的view 上(相当于所有界面都通过xib来实现)
- 2015.4.1前的总结
- Node.js获取当前代码/启动目录
- easyui动态合并行
- IKAnalyzer 扩展分词库
- 二叉树的遍历(一)
- 写了2个简单的工具脚本用来分发hdfs集群上的文件到所有节点,和远程执行命令
- 关于Android stdio使用的一些小问题的解决方法
- Python 讨厌的MemoryError
- 大神博客资源
- openstack keystone的高可用分析
- C语言HTTP请求GET
- android压力测试命令monkey详解