solr-2 analyzer

来源:互联网 发布:淘宝宝贝优化到首页 编辑:程序博客网 时间:2024/06/04 17:51

charFilter

charfilter应该在tokenizer前,solr中提供的charfilter类有
solr.MappingCharFilterFactory 需要一个mapping文件
solr.HTMLStripCharFilterFactory 自动讲html标签过滤
solr.PatternReplaceCharFilterFactory 按正则匹配替换

tokenizer

一般使用自定义分词器,如ik分词

filter

在tokenizer后,对分词后的结果过滤

其中tokenizer和filter都继承自tokenstream
charfilter,tokenizer,filter组成了analyzer,而一个analyzer相当于一个组件工厂

原创粉丝点击