ElasticSearch 解析机制常见用法库 之 Character Filters常用用法

来源:互联网 发布:网络剪刀手教程 编辑:程序博客网 时间:2024/05/18 01:45

以下三种Character Filter是elasticsearch官方提供的三种,(只有三种哦!)

Mapping Char Filter

通过给定的mappings数据来替换.

mappings

mappings数据.

mappings_path

         一个存放mappings数据的地址,可以把mappings数据写到config配置文件中,然后把             config存放到某个路径下



HTML Strip Char Filter

html_strip 把数据中的html 标签元素剥离出来。例如“<a>”就会变成“a

Pattern Replace Char Filter

 pattern_replace 用正则表达式的方式来替换数据。 pattern 正则表达式“参数” replacement 最后替换后的形式。借鉴了lucene的相关内容,详情请参考:http://lucene.apache.org/core/4_3_1/analyzers-common/org/apache/lucene/analysis/pattern/PatternReplaceCharFilter.html

书写格式:


例子:

1、元数据:"aa bb aa bb" 、pattern="(aa)\\s+(bb)"、    replacement="$1#$2"

输出结果为:"aa#bb aa#bb"

2、元数据:"aa123bb" 、pattern="(aa)\\d+(bb)" 、  replacement="$1 $2"

输出结果为:"aa bb"


0 0
原创粉丝点击