Elasticsearch store属性理解
来源:互联网 发布:黑马人工计划软件 编辑:程序博客网 时间:2024/06/08 13:11
在Elasticsearch创建mapping的时候,需要制定store属性和index属性,对于刚入门es的学者,通常对lucene又不熟悉的人,通常不知道如何设置这两个值。
先来看需求:
在做搜索时,经常会需要对一个分类进行分组,比如搜索"ipad",需要在平板电脑分类下面统计有多少个商品,在电脑配件下面统计有多少个商品,这种统计数量的需求,我们通常会在document里面添加一个分类ID,然后对所有的分类做facet。那么问题出来了,如果分类ID是个整数的话,store属性应该设置true or false?这种整数是否还需要索引?
这个问题,在ES的文档中怎么也找不到,个人一开始又对lucene不熟悉,所以花时间看了一下lucene。通过学习lucene及实际的实践得出,以上需求的设置store应该为no,而index应该设置为not_analyzied。
下面我们来仔细理解一下这两个设置项。
其中index的含义还比较容易理解,一共3个值,no,analyzied,not_analyzied,分别对应'不对该字段进行索引(无法搜索)','分词后索引','以单个关键词进行索引'。就是说,如果这个字段不需要搜索,一般不需要设置为analyzied,但是如果不搜索,针对以上的需求,index应该设置为no吗?请继续往下看。
通常分类在索引的时候都是一个整数或长整数,对应lucene的IntField或LongField,而这两个类在lucene中的第一行注释是:Field that indexes
int
values for efficient range filtering and sorting.(Field that indexes long
values for efficient range filtering and sorting),也就是说,IntField是被索引的,并且这种索引在范围过滤和排序的时候性能非常高。那么问题就很明确了,因为,我们的分类字段也是作为filter项的,因此如果要做过滤,必须进行索引。否则可能无法作为过滤条件。实际上,我们在创建mapping的时候,如果设置了数据类型为integer,其他的都未指定,默认的index即为no_analyzied。至于store,采用默认值也是合适的(默认为no),实际上这些默认值都是lucene的默认值。因为一般我们是用不到store='yes'的功能的,除非,我们需要对某个域(就是字段)进行高亮显示。
你可能会问,如果设置store:"no",会不会影响facet的性能。答案为不会,因为做facet的时候并不会使用store的字段,而是使用的索引表的词。也就是后面设置的index:'not_analyzied"。
我自己做过一个测试,如果设置分类ID不索引,则无法进行facet,可见任何需要facet的字段,必须进行索引。
0 0
- Elasticsearch store属性理解
- 详解ElasticSearch的store属性
- elasticsearch的store属性跟_source字段
- elasticsearch的store属性跟_source字段
- elasticsearch 设置 mapping 时的 store 属性
- elasticsearch的store属性跟_source字段
- 图解Elasticsearch中的_source、_all、store和index属性
- 图解Elasticsearch中的_source、_all、store和index属性
- Elasticsearch中的_source、_all、store和index属性
- 图解Elasticsearch中的_source、_all、store和index属性
- 图解Elasticsearch中的_source、_all、store和index属性
- 图解Elasticsearch中的_source、_all、store和index属性
- 图解Elasticsearch中的_source、_all、store和index属性
- 图解Elasticsearch中的_source、_all、store和index属性
- elasticsearch index and store
- Elasticsearch中的store field跟non-store field的区别
- Elasticsearch as a Time Series Data Store
- ElasticSearch.yml 配置文件属性
- 在Ubuntu 12.04 上编译调试 OpenJDK8
- Leetcode【34】:Search insert Position
- 让elasticsearch(es)分片分布在不同的机器上
- POJ3295
- XDOJ1178 - 角划分平面
- Elasticsearch store属性理解
- 二分图匹配模版及题型总结
- poj1149 最大流 PIGS
- f发个链接看看
- 佛祖保佑 永无bug
- Java虚拟机的启动与程序的运行
- iOS_导入libxml2.2框架后,找不到<libxml/tree.h>的解决办法
- 资源收藏:扁平化风格的图标
- BZO3065 带插入区间K小值