前言 ES 使用过程中常用的就是查询以及检索,那查询和检索的过程,什么样的呢?

查询流程

  1. GET my-index/_doc/0

4. ES 查询检索的过程 - 图1

  1. Client 将请求发送到任意节点 node,此时 node 节点就是协调节点(coordinating node)。
  2. 协调节点对 id 进行路由,从而判断该数据在哪个shard。
  3. 在 primary shard 和 replica shard 之间 随机选择一个,请求获取 doc。
  4. 接收请求的节点会将数据返回给协调节点,协调节点会将数据返回给Client。

可以通过 preference 参数指定执行操作的节点或分片。默认为随机。

检索流程

  1. GET /my-index/_search

4. ES 查询检索的过程 - 图2

  1. Client 将请求发送到任意节点 node,此时 node 节点就是协调节点(coordinating node)
  2. 协调节点进行分词等操作后,去查询所有的 shard (primary shard 和 replica shard 选择一个)
  3. 所有 shard 将满足条件的数据 id 排序字段 等信息返回给路由节点
  4. 路由节点重新进行排序,截取数据后,获取到真正需要返回的数据的 id
  5. 路由节点再次请求对应的 shard (此时有 id 了,可以直接定位到对应shard)
  6. 获取到全量数据,返回给 Client

    总结

    主要介绍了 ES 查询以及检索的流程,不足及错误之处欢迎指正。

    参考文档

  7. 协调节点:https://www.elastic.co/guide/en/elasticsearch/reference/7.9/modules-node.html#coordinating-node