快速入门match_all

查询部分

image-20210721203950559.png
代码解读:

  • 第一步,创建SearchRequest对象,指定索引库名
  • 第二步,利用request.source()构建DSL,DSL中可以包含查询、分页、排序、高亮等
    • query():代表查询条件,利用QueryBuilders.matchAllQuery()构建一个match_all查询的DSL
  • 第三步,利用client.search()发送请求,得到响应

这里关键的API有两个,一个是request.source(),其中包含了查询、排序、分页、高亮等所有功能:
image-20210721215640790.png
另一个是QueryBuilders,其中包含match、term、function_score、bool等各种查询:
image-20210721215729236.png

解析部分

image-20210721214221057.png
elasticsearch返回的结果是一个JSON字符串,结构包含:

  • hits:命中的结果
    • total:总条数,其中的value是具体的总条数值
    • max_score:所有结果中得分最高的文档的相关性算分
    • hits:搜索结果的文档数组,其中的每个文档都是一个json对象
      • _source:文档中的原始数据,也是json对象

因此,我们解析响应结果,就是逐层解析JSON字符串。

代码

  1. @Test
  2. void testMatchAll() throws IOException {
  3. // 1.准备Request
  4. SearchRequest request = new SearchRequest("hotel");
  5. // 2.准备DSL
  6. request.source()
  7. .query(QueryBuilders.matchAllQuery());
  8. // 3.发送请求
  9. SearchResponse response = client.search(request, RequestOptions.DEFAULT);
  10. // 4.解析响应
  11. handleResponse(response);
  12. }
  13. private void handleResponse(SearchResponse response) {
  14. // 4.解析响应
  15. SearchHits searchHits = response.getHits();
  16. // 4.1.获取总条数
  17. long total = searchHits.getTotalHits().value;
  18. System.out.println("共搜索到" + total + "条数据");
  19. // 4.2.文档数组
  20. SearchHit[] hits = searchHits.getHits();
  21. // 4.3.遍历
  22. for (SearchHit hit : hits) {
  23. // 获取文档source
  24. String json = hit.getSourceAsString();
  25. // 反序列化
  26. HotelDoc hotelDoc = JSON.parseObject(json, HotelDoc.class);
  27. System.out.println("hotelDoc = " + hotelDoc);
  28. }
  29. }

全文检索查询

全文检索的match和multi_match查询与match_all的API基本一致。差别是查询条件,也就是query的部分。
因此,Java代码上的差异主要是request.source().query()中的参数了。同样是利用QueryBuilders提供的方法:

  1. //单字段查询
  2. QueryBuilders.matchQuery("all","如家");
  3. //多字段查询
  4. QueryBuilders.multiMatchQuery("如家","name","business");

精确查询

精确查询主要是两者:

  • term:词条精确匹配
  • range:范围查询

与之前的查询相比,差异同样在查询条件,其它都一样。
查询条件构造的API如下:

  1. //词条查询
  2. QueryBuilders.termQuery("city","北京");
  3. //范围查询
  4. QueryBuilders.rangeQuery("price").gte(100).lte(150);

地理查询

  1. //附近查询
  2. QueryBuilders.geoDistanceQuery("location").distance("15km");
  3. //方块区域查询
  4. QueryBuilders.geoBoundingBoxQuery("location").topLeft().reset(31.1,121.5);
  5. QueryBuilders.geoBoundingBoxQuery("location").bottomRight().reset(30.9,121.7);

布尔查询

布尔查询是用must、must_not、filter等方式组合其它查询,代码示例如下:

  1. @Test
  2. void testBool() throws IOException {
  3. // 1.准备Request
  4. SearchRequest request = new SearchRequest("hotel");
  5. // 2.准备DSL
  6. // 2.1.准备BooleanQuery
  7. BoolQueryBuilder boolQuery = QueryBuilders.boolQuery();
  8. // 2.2.添加term
  9. boolQuery.must(QueryBuilders.termQuery("city", "杭州"));
  10. // 2.3.添加range
  11. boolQuery.filter(QueryBuilders.rangeQuery("price").lte(250));
  12. request.source().query(boolQuery);
  13. // 3.发送请求
  14. SearchResponse response = client.search(request, RequestOptions.DEFAULT);
  15. // 4.解析响应
  16. handleResponse(response);
  17. }

算分函数查询

image-20210722102850818.png

  1. //算分函数查询
  2. FunctionScoreQueryBuilder functionScoreQuery = QueryBuilders.functionScoreQuery(
  3. //里面有两个参数
  4. //1.原始查询,可以是任何的查询,布尔查询,全文检索查询等,要有相关性算分的查询
  5. boolQuery,
  6. //2.function score,是个数组,里面包括过滤器(什么条件的文档要算分)和算分函数(怎么个算法,相加,还是相乘)
  7. new FunctionScoreQueryBuilder.FilterFunctionBuilder[]{
  8. // 其中的一个function score 元素,可以有很多个,外层是个数组
  9. new FunctionScoreQueryBuilder.FilterFunctionBuilder(
  10. // 过滤条件
  11. QueryBuilders.termQuery("isAD", true),
  12. // 算分函数
  13. ScoreFunctionBuilders.weightFactorFunction(10)
  14. )
  15. //加权模式,是functionScoreQuery()的方法,不写就默认是multiply
  16. }).boostMode(CombineFunction.SUM);
  17. request.source().query(functionScoreQuery);

排序和分页

搜索结果的排序和分页是与query同级的参数,因此同样是使用request.source()来设置。
image-20210721221121266.png

  1. @Test
  2. void testPageAndSort() throws IOException {
  3. // 页码,每页大小
  4. int page = 1, size = 5;
  5. // 1.准备Request
  6. SearchRequest request = new SearchRequest("hotel");
  7. // 2.准备DSL
  8. // 2.1.query
  9. request.source().query(QueryBuilders.matchAllQuery());
  10. // 2.2.排序 sort
  11. request.source().sort("price", SortOrder.ASC);
  12. // 2.3.分页 from、size
  13. request.source().from((page - 1) * size).size(5);
  14. // 3.发送请求
  15. SearchResponse response = client.search(request, RequestOptions.DEFAULT);
  16. // 4.解析响应
  17. handleResponse(response);
  18. }

距离排序

image-20210722095227059.png

  1. request.source().sort(SortBuilders
  2. .geoDistanceSort("location",new GeoPoint("31.21,121,5"))
  3. .order(SortOrder.ASC)
  4. .unit(DistanceUnit.KILOMETERS));

要想知道距离多远,结果在sort里面,和_source同级的json字段,需要改变结果解析

高亮

  • 查询的DSL:其中除了查询条件,还需要添加高亮条件,同样是与query同级。
  • 结果解析:结果除了要解析_source文档数据,还要解析高亮结果

    highlight和query是同级的,所以也是用request.source。高亮查询必须使用全文检索查询,并且要有搜索关键字,将来才可以对关键字高亮。

image-20210721221744883.png

  1. @Test
  2. void testHighlight() throws IOException {
  3. // 1.准备Request
  4. SearchRequest request = new SearchRequest("hotel");
  5. // 2.准备DSL
  6. // 2.1.query
  7. request.source().query(QueryBuilders.matchQuery("all", "如家"));
  8. // 2.2.高亮,可以用链式编程,需要什么就点什么
  9. request.source().highlighter(new HighlightBuilder().field("name").requireFieldMatch(false));
  10. // 3.发送请求
  11. SearchResponse response = client.search(request, RequestOptions.DEFAULT);
  12. // 4.解析响应
  13. handleResponse(response);
  14. }

高亮的结果与查询的文档结果默认是分离的,并不在一起。
因此解析高亮的代码需要额外处理:
image-20210721222057212.png

  1. private void handleResponse(SearchResponse response) {
  2. // 4.解析响应
  3. SearchHits searchHits = response.getHits();
  4. // 4.1.获取总条数
  5. long total = searchHits.getTotalHits().value;
  6. System.out.println("共搜索到" + total + "条数据");
  7. // 4.2.文档数组
  8. SearchHit[] hits = searchHits.getHits();
  9. // 4.3.遍历
  10. for (SearchHit hit : hits) {
  11. // 获取文档source
  12. String json = hit.getSourceAsString();
  13. // 反序列化
  14. HotelDoc hotelDoc = JSON.parseObject(json, HotelDoc.class);
  15. // 获取高亮结果
  16. Map<String, HighlightField> highlightFields = hit.getHighlightFields();
  17. if (!CollectionUtils.isEmpty(highlightFields)) {
  18. // 根据字段名获取高亮结果
  19. HighlightField highlightField = highlightFields.get("name");
  20. if (highlightField != null) {
  21. // 获取高亮值
  22. String name = highlightField.getFragments()[0].string();
  23. // 覆盖非高亮结果
  24. hotelDoc.setName(name);
  25. }
  26. }
  27. System.out.println("hotelDoc = " + hotelDoc);
  28. }
  29. }