IKAnalyzer 在项目中的应用及在网上查询的部分实例资料
来源:互联网 发布:android 开发必备软件 编辑:程序博客网 时间:2024/06/05 02:40
IK Analyzer是基于lucene实现的分词开源框架,下载路径:http://code.google.com/p/ik-analyzer/downloads/list
需要在项目中引入:
IKAnalyzer.cfg.xml
IKAnalyzer2012.jar
lucene-core-3.6.0.jar
stopword.dic
项目中的应用
private String convertKeyword(String keyWord) throws Exception{if(keyWord == null){return "";}StringBuffer retuString = new StringBuffer();//默认是最细粒度分词,智能切分词传trueIKAnalyzer analyzer = new IKAnalyzer(); TokenStream tokenStream = analyzer.tokenStream("content",new StringReader(keyWord));tokenStream.addAttribute(TermAttribute.class);tokenStream.reset(); while (tokenStream.incrementToken()) {TermAttribute charTermAttribute = (TermAttribute) tokenStream.getAttribute(TermAttribute.class);String participle = charTermAttribute.toString().split("=").length > 1 ? charTermAttribute.toString().split("=")[1] : "";retuString.append(participle).append(" ");}tokenStream.end();tokenStream.close();return retuString.toString();}
示例代码如下(使用IK Analyzer):
运行后结果:
基于|Java|语言|开发|的|轻量级|的|中文|分词|工具包|
使用(lucene)实现:
0 0
- IKAnalyzer 在项目中的应用及在网上查询的部分实例资料
- Lucene在结果中查询的机制及在我们项目中的应用
- spring quartz在项目中的应用实例
- Solr的原理及在项目中的使用实例.
- QT静态编译及在VS2008中的详细配置——纠正了网上静态编译资料的错误
- PowerDesigner介绍及在项目中的应用
- 工厂模式及在项目中的应用
- 网上复制文本在 Word 中空行的处理及部分字符
- LayUI的表格在项目中的应用
- 对在C#中的消息应用的资料收集
- FCK在实例中的应用
- 在网上看到的“循环和递归在算法中的应用”,感觉不错,转载一下
- android在工业中的应用资料收集
- Log4net简介及在项目中的简单应用
- 在网上找的javascript的内置对象的资料
- 今天在网上查资料时找到的。
- MySQL基础知识点(在网上总结的资料)
- 在网上查找资料,学习define和inline的区别
- Redis的持久化
- jxl操作excel --API
- MySQL解决乱码问题
- PowerDesigner生成html文档和rdf文档
- JavaWeb学习总结(二)——Tomcat服务器学习和使用(一)
- IKAnalyzer 在项目中的应用及在网上查询的部分实例资料
- 模式化窗口及marguee
- 理解Fragment生命周期
- JavaWeb学习总结(三)——Tomcat服务器学习和使用(二)
- mysql 解决中文乱码
- URL 含中文 链接不上
- vim 常用命令
- EL表达式
- 直播疑难杂症排查 — 序