IKAnalyzer添加用户自定字典
来源:互联网 发布:企业微信管理系统源码 编辑:程序博客网 时间:2024/05/19 03:46
IKAnalyzer添加用户自定字典
1. 部署IKAnalyzer.cfg.xml
IKAnalyzer.cfg.xml部署在代码根目彔下(对亍web项目,通常是WEB-INF/classes目彔)同hibernate、log4j等配置文件相同。
classes于lib目录同级,但是这个目录是没有要自己手动创建
/home/eboss/jetty-solr/webapps/solr/WEB-INF/classes/IKAnalyzer.cfg.xml
/home/eboss/jetty-solr/webapps/solr/WEB-INF/classes/mydict.dict
/home/eboss/jetty-solr/webapps/solr/WEB-INF/classes/ext_stopword.dict
2. 词典文件的编辑与部署
分词器的词典文件格式是无BOM的UTF-8编码的中文文本文件,文件扩展名不限。词典中,每个中文词汇独立占一行,使用\r\n的DOS方式换行。(注,如果您不了解什么是无BOM的UTF-8格式, 请保证您的词典使用UTF-8存储,并在文件的头部添加一空行)。您可以参考分词器源码org.wltea.analyzer.dic包下的.dic文件。
词典文件应部署在Java的资源路径下,即ClassLoader能够加载的路径中。(推荐同IKAnalyzer.cfg.xml放在一起)
3. IKAnalyzer.cfg.xml文件的配置
<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd"><properties> <comment>IK Analyzer 扩展配置</comment> <!--用户可以在这里配置自己的扩展字典 --> <entry key="ext_dict">mydict.dic; /com/mycompany/dic/mydict2.dic;</entry> <!--用户可以在这里配置自己的扩展停止词字典--> <entry key="ext_stopwords">ext_stopword.dic</entry></properties>
以上配置来源IKAnalyzer中文分词器V2012_FF使用手册.pdf,IK的其他配置方法同样可参见此使用手册。
配置完成后或添加自定义分词后要重启solr才能生效
0 0
- IKAnalyzer添加用户自定字典
- mysql 5.0 用户自定安装图解
- framework下添加自定jni
- 自定意义cell左右滑动,添加自定意义button
- iOS 自定意义cell左右滑动,添加自定意义button
- c# 自定用户控件配置(两种情况)
- php用户自定过滤非法sql注入字符串函数
- [Windows7]在开始菜单右侧添加一个自定义项
- 零件库的族添加自定义行
- Android build.prop 添加自定义项 及使用
- solr添加IKAnalyzer分词器
- Solr 添加 IKAnalyzer分词器
- 八、使用IKAnalyzer自定义分词字典
- IKAnalyzer
- IKAnalyzer
- 自定UrlToCode函数
- WinForm自定分页
- 自定義控件
- 锚点平滑跳转
- Java中字符串的一些基本操作
- jquery的post方法 使用从后台获取回来的数据
- DataMatrix编码 关于libdmtx的使用
- 理解Storm拓扑的并行
- IKAnalyzer添加用户自定字典
- miniUI界面
- iOS 7兼容
- 静态常量(static final)在class文件中是怎样的呢?
- calendar的使用
- 【再思考】PATBasic——1024. 科学计数法 (20)
- 童年的友情你还记得?
- Autolayout优秀的第三方开源库
- SQL调优(连接方式)