Lucene同义词(一)
来源:互联网 发布:设计店铺的软件 编辑:程序博客网 时间:2024/05/21 06:16
package com.yuan;import java.io.IOException;import java.util.HashMap;import java.util.Map;import org.apache.lucene.analysis.TokenStream;import org.apache.lucene.analysis.synonym.SynonymFilterFactory;import org.apache.lucene.analysis.tokenattributes.CharTermAttribute;import org.apache.lucene.analysis.tokenattributes.OffsetAttribute;import org.apache.lucene.analysis.util.FilesystemResourceLoader;import org.apache.lucene.util.Version;import org.wltea.analyzer.lucene.IKAnalyzer;/** * @author hankcs */public class TestSynonyms{ private static void displayTokens(TokenStream ts) throws IOException { CharTermAttribute termAttr = ts.addAttribute(CharTermAttribute.class); OffsetAttribute offsetAttribute = ts.addAttribute(OffsetAttribute.class); ts.reset(); while (ts.incrementToken()) { String token = termAttr.toString(); System.out.print(offsetAttribute.startOffset() + "-" + offsetAttribute.endOffset() + "[" + token + "] "); } System.out.println(); ts.end(); ts.close(); } public static void main(String[] args) throws Exception { String testInput = "其实 i似 好人"; Version ver = Version.LUCENE_47; Map<String, String> filterArgs = new HashMap<String, String>(); filterArgs.put("luceneMatchVersion", ver.toString()); filterArgs.put("synonyms", "c:/同义词/synonymword.dic"); //filterArgs.put("expand", "true"); SynonymFilterFactory factory = new SynonymFilterFactory(filterArgs); factory.inform(new FilesystemResourceLoader()); IKAnalyzer ikAnalyzer = new IKAnalyzer(); TokenStream ts = factory.create(ikAnalyzer.tokenStream("someField", testInput)); displayTokens(ts); }}由于在同义词库的编码与读取文件所设的编码不一致,导致开始时中文同义词不好使。
0 0
- Lucene同义词(一)
- Lucene 同义词
- lucene-同义词分析器
- Lucene 同义词搜索
- Lucene自定义同义词分词器
- lucene构建同义词分词器
- Lucene同义词检索同时精确提取自定义关键词(Lucene版本5.3.0)
- lucene笔记(一)
- lucene 漫谈(一)
- lucene学习(一)
- LUCENE入门(一)
- Lucene入门教程(一)
- Lucene入门教程(一)
- Lucene教程(一 )
- Lucene入门(一)
- Lucene初学(一)
- Lucene入门教程(一)
- Lucene学习(一)
- 电脑与CDI9600变频器的RS485通讯
- C# 中的委托和事件(详解,附实例)
- Codeforces Round #254 (Div. 2)
- ORACLE计算一年的12个月份及一些日期函数
- javaEE开发之文件下载
- Lucene同义词(一)
- MySQL数据库新特性之存储过程入门教程
- 看《立方体》观感
- javascript 常用
- Java中8中基本类型(内置类型)
- Ubuntu前后台程序切换
- Linux VI/VIM常用命令
- 广州传智播客.Net培训课程优势多多
- php时间出现Warning: date(): It is not safe to rely on the system's timezone settings. You are *required*