聚合（aggregations ）可以让我们极其方便的实现对数据的统计、分析、运算。

什么品牌的手机最受欢迎？
这些手机的平均价格、最高价格、最低价格？
这些手机每月的销售情况如何？

聚合的种类
聚合常见的有三类：
桶（Bucket）聚合：用来对文档做分组
- TermAggregation：按照文档字段值分组，例如按照品牌值分组、按照国家分组
- Date Histogram：按照日期阶梯分组，例如一周为一组，或者一月为一组
度量（Metric）聚合：用以计算一些值，比如：最大值、最小值、平均值等
- Avg：求平均值
- Max：求最大值
- Min：求最小值
- Stats：同时求max、min、avg、sum等

管道（pipeline）聚合：其它聚合的结果为基础做聚合 :::danger 注意：参加聚合的字段必须是keyword、日期、数值、布尔类型 :::

DSL实现聚合

Bucket聚合

现在，我们要统计所有数据中的酒店品牌有几种，其实就是按照品牌对数据分组。此时可以根据酒店品牌的名称做聚合，也就是Bucket聚合。

GET /hotel/_search
{
"size": 0,   #设置size为0，结果中不包含文档，只包含聚合结果
"aggs": {   #定义聚合，可以有多个聚合，一个名字一个聚合，不影响，如果要根据a聚合的基础上执行b聚合，在a聚合里面写子聚合，看下面的pipline聚合
  "brandAgg": {   #给聚合起个名字，随意取的
    "terms": {   #聚合的类型，按照品牌值聚合，所以选择term
      "field": "brand",   #参与聚合的字段brand
      "size": 20   #希望获取的聚合结果数量
    }
  }
}
}

聚合结果排序

默认情况下，Bucket聚合会统计Bucket内的文档数量，记为_count，并且按照_count降序排序。
我们可以指定order属性，自定义聚合的排序方式：

GET /hotel/_search
{
"size": 0,
"aggs": {
  "brandAgg": {
    "terms": {
      "field": "brand",
      "order": {
        "_count": "asc"   #按照_count升序排列，写doc_count报错
      },
      "size": 20
    }
  }
}
}

限定聚合范围

默认情况下，Bucket聚合是对索引库的所有文档做聚合，但真实场景下，用户会输入搜索条件，因此聚合必须是对搜索结果聚合。那么聚合必须添加限定条件。
我们可以限定要聚合的文档范围，只要添加query条件即可：

GET /hotel/_search
{
"query": {   #加入查询就可以限制聚合范围了
  "range": {
    "price": {
      "lte": 200   #只对200元以下的酒店聚合
    }
  }
},
"size": 0,
"aggs": {
  "brandAgg": {
    "terms": {
      "field": "brand",
      "order": {
        "_count": "asc"
      },
      "size": 20
    }
  }
}
}

Metric聚合

统计酒店的平均分，最高分，最低分，总分等

GET /hotel/_search
{
"size": 0,
"aggs": {
  "score_stats": {  #聚合名称
    "stats": {   #聚合类型，这里stats可以计算min、max、avg等
      "field": "score"  #聚合字段，这里是score
    }
  }
}
}

pipeline聚合

获取每个品牌的用户评分的min、max、avg等值，就要用到Bucket和Metric联合聚合了

GET /hotel/_search
{
"size": 0,
"aggs": {
  "brandAgg": {
    "terms": {
      "field": "brand",
      "size": 20
    },
    "aggs": {   #是brands聚合的子聚合，也就是分组后对每组分别计算
      "score_stats": {
        "stats": {
          "field": "score"
        }
      }
    }
  }
}
}

RestClient实现聚合

聚合条件与query条件同级别，因此需要使用request.source()来指定聚合条件。
聚合条件的语法：

聚合的结果也与查询结果不同，API也比较特殊。不过同样是JSON逐层解析：

  @Test
  void testBucket() throws IOException {
      // 1.准备Request
      SearchRequest request = new SearchRequest("hotel");
      //准备DSL
      request.source().size(0);
      request.source().aggregation(
              AggregationBuilders.terms("brands").field("brand").size(20)
      );
      // 3.发送请求
      SearchResponse response = client.search(request, RequestOptions.DEFAULT);
      // 4.解析响应
      //4.1解析聚合结果
      Aggregations aggregations = response.getAggregations();
      //4.2根据名字获取聚合结果
      Terms brands = aggregations.get("brands");
      //4.3获取桶
      List<? extends Terms.Bucket> buckets = brands.getBuckets();
      //4.4遍历
      for(Terms.Bucket bucket:buckets){
          //4.5获取品牌信息和文档数量信息
          String brandName = bucket.getKeyAsString();
          long docCount = bucket.getDocCount();
          System.out.println(brandName+docCount);
      }
  }

编程圣经

数据聚合

聚合的种类