编写工具展示lucene分词内部分析过程
来源:互联网 发布:动漫网站php源码 编辑:程序博客网 时间:2024/05/03 23:15
此代码工具可以展示:对应的语汇单元还有多个属性没有在代码中展示,可查看包org.apache.lucene.analysis.tokenattributes里所有的attribute
package com.liu.lucene.pro;
import java.io.IOException;
import java.io.Reader;
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.tokenattributes.CharTermAttribute;
import org.apache.lucene.analysis.tokenattributes.PositionIncrementAttribute;
public class AnalyzerUtils {
public static void displayTokens(Analyzer analyzer,Reader reader){
try {
TokenStream tokenStream = analyzer.tokenStream("path", reader);
tokenStream.reset();
CharTermAttribute term = tokenStream.addAttribute(CharTermAttribute.class);
PositionIncrementAttribute posIncrAtt = tokenStream.addAttribute(PositionIncrementAttribute.class);
while(tokenStream.incrementToken()){
System.out.print("["+term.toString()+"]");
}
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
- 编写工具展示lucene分词内部分析过程
- Lucene 分词的过程
- lucene 分词工具使用
- lucene--分词器的分析
- lucene--分词器的分析
- Lucene的分析过程
- Lucene的分析过程
- Lucene的分析过程
- 03_java Lucene学习——分词Analyzer(01):lucene4.0展示分词结果
- lucene分词
- lucene分词
- Lucene 分词
- 【Lucene实战】Lucene的分析过程
- lucene分词器分词
- Lucene全文搜索工具分析
- Lucene之庖丁分词器及性能分析
- lucene(2)——分析和写分词器
- 展示一下Lucene+自创中文分词而做的电影、论坛搜索引擎
- linux系统软件安装
- linux下搭建一个xampp环境进行性能测试
- Spring-AOP切面+Aspectj框架的使用
- C#中数据库中image类型可转为byte[]类型
- 总线设备驱动模型----驱动篇
- 编写工具展示lucene分词内部分析过程
- Android初学习 - Broadcast Receiver的介绍02
- AOP实现原理——动态代理
- Android性能优化
- Android图片压缩(质量压缩和尺寸压缩)
- Spring快速入门
- PTA 链表删除结点的题目测试
- HDU 1087 Super Jumping! Jumping! Jumping!(最大的上升子序列的和)(不是最长)(易混淆)
- 关于platform_driver 是如何匹配 platform_device的和如何调用到platform_driver中的probe函数的研究