Lucene V3.0.2分词、高亮
来源:互联网 发布:java精彩编程200例 编辑:程序博客网 时间:2024/05/16 07:03
Lucene版本升级到3.0以后,原来的分词方式(token=tokenStream.next())的方式已经被抛弃,转而使用TermAttribute,本例使用SmartChineseAnalyzer演示如何分词,此外,本例还演示了如何对命中文档域进行高亮显示。
本例需要使用四个jar包:
lucene-core-3.0.3.jar
lucene-highlighter-3.0.2.jar
lucene-smartcn-3.0.2.jar
lucene-memory-3.0.2.jar
在高亮时有一个特别需要注意的问题:
当输入的查询词为"人民币升值"时,会抛出NoClassDefFoundError:org/apache/lucene/index/memory/MemoryIndex异常,如果将“人民币”与“升值”使用空格分开,则不会出现此异常。
解决方式是将lucene-memory-3.0.2.jar添加到classpath中。
- Lucene V3.0.2分词、高亮
- Lucene 高亮 分词 搜索
- lucene学习--分词和高亮显示
- lucene学习--分词和高亮显示
- Lucene分词器及高亮
- Lucene高亮显示及中文分词
- lucene.net 2.0 中文分词后语法高亮问题
- lucene.net 2.0 中文分词后语法高亮问题
- Lucene 中文分词、分页、高亮 索引TXT
- Lucene 3.6 中文分词、分页查询、高亮显示等
- Lucene实现自定义分词器(同义词查询与高亮)
- Lucene基础(三)-- 中文分词及高亮显示
- lucene整合中文分词器mmseg4j和高亮highlighter
- Lucene中文分词以及关键字的高亮
- lucene---中文分词IKAnalyzer和高亮highlighter的使用
- lucene(五) 中文分词和高亮显示
- Lucene开发实例教程:Lucene中文分词、分页查询、高亮显示
- 【Lucene】Apache Lucene全文检索引擎架构之中文分词和高亮显示
- abstract抽象与virtual虚函数
- 我糊涂的进来了
- C# 面向方面 通过Attribute 拦截从而扩展方法
- 在centos中用Heartbeat配置高可用性服务器集群
- Oracle11g新特性:Flashback Data Archive
- Lucene V3.0.2分词、高亮
- c# 在连接mysql(4.0) 乱码问题
- Oracle11g sql*plus新特性:Show Spparameters
- 获取来自定义控件(继承自Contro基类)的定义在Generic.xaml或其他*.xaml中的对象
- 母版页Master中Html控件img,a,javascript相对路径问题
- 解决 CentOS5.5连接Ubuntu10.10 NFS服务器的问题
- Oracle11g新特性:使用DBMS_COMPARISON比较数据库对象
- Oracle 11g的Server Result Cache特征
- boost.thread时间的设置