Elasticsearch之排序。

来源：互联网发布：欧朋安卓浏览器开启js 编辑：程序博客网时间：2024/04/29 21:48

Explain Api

当explain选项加到某一文档上时，他会告诉你为何这个文档会被匹配，以及一个文档为何配有被匹配。

请求路径为 /index/type/id/_explain，如下所示：

GET /us/tweet/12/_explain

{

"query" : {

"filtered" : {

"filter" : { "term" : { "user_id" : 2 } },

"query" : { "match" : { "tweet" : "honeymoon" } }

}

除了上面我们看到的完整描述外，我们还可以看到这样的描述：

也就是说我们的user_id过滤子句使该文档不能匹配到。

本文的目的在于介绍关于Elasticsearch内部的一些运行情况。

当你对一个字段进行排序时，Elasticsearch需要进入每个匹配到的文档得到相关的值。倒排索引在用于搜索时是非常卓越的，但却不是理想的排序结构。

为了提高排序效率，Elasticsearch会将所有字段的值加载到内存中，这就叫做“数据字段”。

重要：Elasticsearch将所有字段数据加载到内存中并不是匹配的那部分数据。而是索引下所有文档中的值，包括所有类型。

将所有字段数据加载到内存中因为从硬盘反向倒排序索引是非常缓慢的。尽管你这次请求需要的是某些文档的部分数据，但你下个请求却需要另外的数据，所以讲所有字段数据一次性加载到内存中是十分必要的。

Elasticsearch中的字段数据常被应用到以下场景：

毫无疑问，这会消耗掉很多内存，尤其是大量的字符串数据——String字段可能包含很多不同的值，比如邮件内容。值得庆幸的是，内存不足时可以通过横向扩展解决的，我们可以增加更多的节点到集群。

现在，你只需要知道字段数据是什么，和什么内存不足就可以了。

阅读全文

0 0