一个 ES Index 在集群模式下,有多个 Node(节点)组成,每个节点就是 ES 的 Instance (实例)。
每个节点上会有多个 Shard(分片),其中 P1、P2 是主分片,R1、R2 是副本分片。
每个分片上对应着就是一个 Lucene Index(底层索引文件)。
Lucene Index 是一个统称,由多个 Segment(段文件,就是倒排索引)组成。每个段文件存储着就是 Doc 文档,Commit Point 记录了所有 segments 的信息。
Lucene 索引结构
上图中 Lucene 的索引结构中有哪些文件呢?
这些不同后缀的文件解释如下:
参考链接:https://lucene.apache.org/core/7_2_1/core/org/apache/lucene/codecs/lucene70/package-summary.html#package.description
不同执行阶段所需的文件类型如下图所示: