索引段

原文链接 : https://www.elastic.co/guide/en/elasticsearch/reference/current/indices-segments.html

译文链接 : 索引段

贡献者 : 飞师傅

提供 Lucene 索引构建的低级别段信息。允许用于提供分片和索引状态、可优化信息和删除引起的数据”浪费“等详细信息。

端点包括特定索引、多个索引或者全部的段。

  1. curl -XGET 'http://localhost:9200/test/_segments'
  2. curl -XGET 'http://localhost:9200/test1,test2/_segments'
  3. curl -XGET 'http://localhost:9200/_segments'

响应:

  1. {
  2. ...
  3. "_3": {
  4. "generation": 3,
  5. "num_docs": 1121,
  6. "deleted_docs": 53,
  7. "size_in_bytes": 228288,
  8. "memory_in_bytes": 3211,
  9. "committed": true,
  10. "search": true,
  11. "version": "4.6",
  12. "compound": true
  13. }
  14. ...
  15. }

_0

JSON文档的键是段的名字。此名称用户生成文件名:在分片目录中以此名称开头的所有文件都属于此段。

generation

当需要写入新的段时 ,generation 的数值会递增。段名称源于这个 generation数值。

num_docs

此分段中存储的未删除文档的数量。

deleted_docs

此分段中存储的已删除文档的数量。如果这个数字大于0,则当此分段合并时回收空间是完全正常的。

size_in_bytes

此分段使用的磁盘空间,单位是bytes。

memory_in_bytes

分段需要将一些数据存储到内存中以便高效搜索。此数字设置内存的字节数来达到此目的。当这个值为-1时 Elasticsearch 不会计算该值。

committed

表示分段是否已经在磁盘上同步。提交的分段可以在硬重启后保留。未提交的分段也会保存在事务日志中,以便 Elasticsearch 在下一次启动时重放变更,所以此值为false也无需担心。

search

表示该分段是否可以搜索。当值为false时很可能意味着改分段已经写入磁盘,但是之后没用刷新让它可以搜索。

version

表示编写此分段的Lucene版本。

compound

表示此分段是否存储在复合文件中。当为true时,这表示Lucene将分段中的所有文件都合并在一个文件中,以保存文件描述符。

详细模式

要添加用于调试的附加信息,要使用verbose标志。

附加详细信息的格式处于实验阶段,随时可能修改。

  1. curl -XGET 'http://localhost:9200/test/_segments?verbose=true'

响应:

  1. {
  2. ...
  3. "_3": {
  4. ...
  5. "ram_tree": [
  6. {
  7. "description": "postings [PerFieldPostings(format=1)]",
  8. "size_in_bytes": 2696,
  9. "children": [
  10. {
  11. "description": "format 'Lucene50_0' ...",
  12. "size_in_bytes": 2608,
  13. "children" :[ ... ]
  14. },
  15. ...
  16. ]
  17. },
  18. ...
  19. ]
  20. }
  21. ...
  22. }