基于Lucene shingle英文单词NGram Analyzer的实现
来源:互联网 发布:win10网络连接图标不见 编辑:程序博客网 时间:2024/04/29 18:35
此例为基于Lucene shingle英文单词BiGram Analyzer的实现
import java.io.Reader;import org.apache.lucene.analysis.Analyzer;import org.apache.lucene.analysis.LowerCaseFilter;import org.apache.lucene.analysis.TokenStream;import org.apache.lucene.analysis.WhitespaceTokenizer;import org.apache.lucene.analysis.shingle.ShingleFilter;import org.apache.lucene.util.Version;public final class BiGramAnalyzer extends Analyzer { @Override public TokenStream tokenStream(String fieldName, Reader reader) { TokenStream result = new WhitespaceTokenizer(Version.LUCENE_36, reader); result = new LowerCaseFilter(Version.LUCENE_36, result); ShingleFilter shingleFilter = new ShingleFilter(result, 2); shingleFilter.setOutputUnigrams(false); result = shingleFilter; return result; }}
http://searchhub.org/2010/12/17/whats-a-shingle-in-lucene-parlance/
- 基于Lucene shingle英文单词NGram Analyzer的实现
- 基于NLPIR的lucene 自定义Analyzer实现类
- Lucene分词实现:Analyzer、TokenStream
- Lucene分词实现:Analyzer、TokenStream
- lucene-NGram中文分词
- lucene Ngram 划分词语
- Lucene的分词器Analyzer
- Lucene的分词器Analyzer
- Lucene的分词器Analyzer
- Lucene的分词器Analyzer
- lucene Analyzer
- Lucene--Analyzer
- SHINGLE
- Lucene常用的Analyzer功能概述
- Lucene内置的Analyzer分词器
- Lucene学习总结之十:Lucene的分词器Analyzer
- Lucene学习总结之十:Lucene的分词器Analyzer
- 基于lucene实现自己的推荐引擎
- 动画效果
- c++的跨平台的读写锁的实现
- Test attack
- 游戏编程岗位技能需求整理
- iOS开发 ( iPhone/iPad):利用ffmpeg 实现音频解码、声音播放
- 基于Lucene shingle英文单词NGram Analyzer的实现
- 从头到尾教你写个简单的贪吃蛇游戏
- 游戏编程入门学习笔记16——又添加第二个小人
- Mindjet.MindManager.v9.0“参数错误”解决办法
- DB2 Merge Into语句的使用
- DB2 向表中写数据的几种方法
- 浅谈MongoDB之二 备份与修复(13/04 补充)
- Mysql中使用UNION语句进行多表连接查询
- A Distributed Systems Reading List