转文:使用lucene中文分析器优化中文检索

来源:互联网 发布:2016淘宝流量突然暴跌 编辑:程序博客网 时间:2024/06/06 09:20

http://www.liferay.com/web/gavin.wan/blog/-/blogs/trackback/使用lucene中文分析器优化中文检索

 

 

使用lucene中文分析器 替换 Liferay 默认的StandardAnalyzer(一元分词)提高中文检索的质量。

portal-ext.properties
 #lucene.analyzer=org.apache.lucene.analysis.standard.StandardAnalyzer

可选中文分析器

org.wltea.analyzer.lucene.IKAnalyzer
http://code.google.com/p/ik-analyzer/

net.paoding.analysis.analyzer.PaodingAnalyzer
http://code.google.com/p/paoding/

org.apache.lucene.analysis.cn.smart.SmartChineseAnalyzer
http://code.google.com/p/imdict-chinese-analyzer/

添加以上分析器依赖的jar包

 讨论各中文分析器性能

 

 

日文的话用:SEN, GOSEN

 

原创粉丝点击