IKAnalyzer在Solr下扩充词典

来源:互联网 发布:手机编程百度专用皮肤 编辑:程序博客网 时间:2024/05/21 17:40
  首先确定的是IKAnalyzer是否能在Solr下正常运行,若不能正常运行,请参考文章Solr & IKAnalyzer 配置。
现在假设IKAnalyzer已经配置好,并且你现在的情况是IK自带的词典无法满足你的分词要求,那么我们就需要添加自己的词库。假设你有一个自己的词库叫ext.dic文件,你想要IK结合你自己的词典进行分词需要进行如下操作:
    1.将你的字典拷贝到tomcat/webapps/solr/WEB_INF/classes中。在classes文件夹有你之前拷贝的IKAnalyzer.cfg.xml文件,打开该文件。
    2.在这里配置你的ext.dic文件的相对路径,因为我们已经将其放入到classes文件中了,因此相对路径就是ext.dic。
        <entry key="ext_dict">ext.dic;</entry> 

    3.配置成功,在接下来的分词中就会结合ext.dic进行分词。

    那么如何自己建立自己的词库呢?现在目前处于测试阶段,就直接找到一个dic文件在里面手动添加词汇。等到实际需要建立词库时再来写一篇吧。
0 0
原创粉丝点击