ElasticSearch 攻略(四)简易搜索

来源:互联网 发布:js正则验证用户名 编辑:程序博客网 时间:2024/05/16 10:04

之前获取 es 是单条“记录”,例如 GetResponse response = client.prepareGet("twitter", "tweet", "1").get(); 如果获取记录列表则要通过“搜索”。最简单的 es 搜索是:

import org.elasticsearch.action.search.SearchResponse;import org.elasticsearch.action.search.SearchType;import org.elasticsearch.index.query.QueryBuilders.*;SearchResponse response = client.prepareSearch().execute().actionGet();// 获取全部

这样太简单了,没有任何条件的搜索,不足以反映 es 的强大。构建一个复杂的搜索,我们需要 SearchRequestBuilder 的帮忙,由它的对象来执行搜索。

SearchRequestBuilder searchRequestBuilder = client.prepareSearch("index1", "index2");searchRequestBuilder .setTypes("type1", "type2"); // es 的搜索 Search 不但联合多个库(index1、index2),而是可以是跨类型的(即跨表的 type1、type2)。//设置查询类型searchRequestBuilder.setSearchType(SearchType.DFS_QUERY_THEN_FETCH);//设置分页信息searchRequestBuilder.setFrom(0).setSize(10);// 按照时间降序searchRequestBuilder.addSort("crawlDate", SortOrder.DESC);// 设置是否按查询匹配度排序searchRequestBuilder.setExplain(true);……

searchRequestBuilder.setSearchType,设置搜索类型,主要的搜索类型有:

  • QUERY_THEN_FETCH:查询是针对所有的块执行的,但返回的是足够的信息,而不是文档内容(Document)。结果会被排序和分级,基于此,只有相关的块的文档对象会被返回。由于被取到的仅仅是这些,故而返回的 hit 的大小正好等于指定的 size。这对于有许多块的 index 来说是很便利的(返回结果不会有重复的,因为块被分组了)
  • QUERY_AND_FETCH:最原始(也可能是最快的)实现就是简单的在所有相关的 shard上执行检索并返回结果。每个 shard 返回一定尺寸的结果。由于每个shard已经返回了一定尺寸的hit,这种类型实际上是返回多个 shard的一定尺寸的结果给调用者。
  • DFS_QUERY_THEN_FETCH:与 QUERY_THEN_FETCH 相同,预期一个初始的散射相伴用来为更准确的 score 计算分配了的term频率。
  • DFS_QUERY_AND_FETCH:与 QUERY_AND_FETCH 相同,预期一个初始的散射相伴用来为更准确的 score 计算分配了的term频率。
  • SCAN:在执行了没有进行任何排序的检索时执行浏览。此时将会自动的开始滚动结果集。
  • COUNT:只计算结果的数量,也会执行 facet。

继续定义 searchRequestBuilder,

searchRequestBuilder.setQuery(QueryBuilders.termQuery("multi", "test"))                 // Query 匹配关键字searchRequestBuilder.setPostFilter(QueryBuilders.rangeQuery("age").from(12).to(18))     // Filter 表示范围

指定查询条件。es 内置丰富的查询条件,我们后面再详述。

最后执行搜索查询,

//执行查询SearchResponse response = searchRequestBuilder.execute().actionGet();SearchHits searchHits = response.getHits();System.out.println("总数:"+searchHits.getTotalHits());SearchHit[] hits = searchHits.getHits();for (SearchHit hit : hits) {    String json = hit.getSourceAsString();}

如果换作 HTTP API,可以通过 _search Action 传人 q= 参数进行 QueryString 搜索:

GET /megacorp/employee/_search?q=last_name:Smith// 另外的写法,效果等价GET /megacorp/employee/_search{    "query" : {        "match" : {            "last_name" : "Smith"        }    }}
0 0