solr进阶九:solr对数字和单个字符的搜索

来源:互联网 发布:网校系统 java 编辑:程序博客网 时间:2024/05/21 11:06

solr中配有分词器,但分词器里面有大写转换为小写的过滤器时,数字就会被过滤。比如123中国ABC123就会被过滤掉了,所以才查1|12|123都会失败。

Solr 数字字符不能搜索的一个问题》这篇博文说得还算详细,我就是学这篇文章的。

 

根据账号来搜索,当账号在数据库中是整型变量时,导入到solr中,配置单个数字的过滤字段时,是搜索不出任何信息的,这不知什么原因,有时间要好好研究一下schema.xml这个配置文件先。

 

schema.xml这个配置文件中加入字段类型:

<fieldType name="text_inclunum" class="solr.TextField" positionIncrementGap="100"><analyzer type="index"><tokenizer class="solr.WhitespaceTokenizerFactory"/><filter class="solr.EdgeNGramFilterFactory" minGramSize="1" maxGramSize="50" side="front"/></analyzer><analyzer type="query"><tokenizer class="solr.WhitespaceTokenizerFactory"/><filter class="solr.EdgeNGramFilterFactory" minGramSize="1" maxGramSize="50" side="front"/></analyzer></fieldType>

"solr.EdgeNGramFilterFactory" minGramSize="1" maxGramSize="50")这个就是从左到右一个一个分词的。

让我们的字段使用这个字段类型:

在分析里面做一下分析,看能不能切割:

没问题!接着在搜索里面搜索:

也没问题,最符合条件的排在前面,其次的排在后面。

剩下的事情就简单了,按照前面的教程,改一下配置参数,输入两个字符就触发:

最后呈现的结果为:

前面的是最符合的:


0 0