IKAnalyzer 独立使用 配置扩展词库

来源:互联网 发布:windows磁盘整理 编辑:程序博客网 时间:2024/05/29 17:55

网上已有不少教程了。

http://www.cnblogs.com/dennisit/archive/2013/04/07/3005847.html

http://blog.sina.com.cn/s/blog_4c9d7da201013wv2.html


这里只说两点:

  1. dic文件要用 “无dom的UTF-8”格式编码
  2. dic文件最好是放在项目的src文件夹下。
我的一个范例截图


对应的IKAnalyzer.cfg.xml文件设置如下:
[html] view plaincopy
  1. <span style="font-size:14px;"><?xml version="1.0" encoding="UTF-8"?>  
  2. <!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">    
  3. <properties>    
  4.     <comment>IK Analyzer 扩展配置</comment>  
  5.     <!--用户可以在这里配置自己的扩展字典 -->  
  6.     <entry key="ext_dict">./dic/scut.dic;</entry>   
  7.       
  8.     <!--用户可以在这里配置自己的扩展停止词字典-->  
  9.     <entry key="ext_stopwords">./dic/stopword.dic;</entry>   
  10.       
  11. </properties></span>  
0 0
原创粉丝点击