eclipse新建.dic文件注意——由使用IKAnalyzer分词器新建ext.dic文件引发的思考
来源:互联网 发布:金和软件官网 编辑:程序博客网 时间:2024/06/05 08:45
当我们用lucene的IKAnalyzer分词器并使用扩展词典的时候,我们会新建一个ext.dic文件,在这里存储一些未被收录的特殊词汇。
在windows系统的eclipse中,当我们新建ext.dic文件后,双击该文件打开,很有可能是由Windows记事本打开的,因为Windows中存在大量的.dic文件,此时要注意记事本默认编码是ANSI ,新建后首次编辑并用记事本保存后,文件编码不是UTF-8。
程序进行分词后,索引库中并不存在写到ext.dic中的扩展词。
解决办法有多种,只要编码是UTF-8就行,保证用改完默认编码的eclipse来编辑,或是用记事本另存编码为UTF-8的文件。
阅读全文
0 0
- eclipse新建.dic文件注意——由使用IKAnalyzer分词器新建ext.dic文件引发的思考
- dic文件
- eclipse 新建Cpp文件
- dic 的遍历方法
- eclipse新建工程文件时常用到的
- readDataToDic.py文件升级改版(附加各个属性的list、dic方法)
- 新建Podfile文件时,使用vim新建
- 新建文件
- python中dic的操作
- Python中list、tupe、dic、set的使用小记
- 快速新建class、新建Package、新建Xml文件的方式
- dedecms indclude/date/base_dic_full.dic是什么文件 V5.7上 8M多,请问这个文件是干啥的?
- lucene的IKAnalyzer分词器的使用
- code dic
- dic+css
- matlab DIC
- 【IntelliJ IDEA】使用idea解决新建jsp文件而找不到jsp文件模版的新建选项
- 文件乱码---源于使用了UE编辑器新建的文件
- Java的字符类String、StringBuffer与StringBuilder异同对比分析
- loj 6062 (hall定理+ 线段树)
- nginx(2)变量转载自章亦春
- AOP配置
- Hibernate学习(二)
- eclipse新建.dic文件注意——由使用IKAnalyzer分词器新建ext.dic文件引发的思考
- 登录请求超时,后台跳转登录页面时,是在子界面显示登录页面的问题
- rapidjson对Writer的小小封装,方便使用
- 南通青鸟 IT教育..._业务抽象
- 求1*2*3*4*...*n的值
- 使用d3画横向组织架构图,兼容ie8 (二)
- java 内存的监控
- CodeForces 873B Balanced Substring(前缀和+思维)
- maven可用的镜像