特点

  1. 分布式
    1. lucene ,只能单机
  2. 搜索
  3. 数据分析

功能

  1. 全文搜索
  2. 数据分析
  3. 结构化检索
  4. 对数据的近实时(Near RealTime)处理
    1. 秒级别,非离线批处理

概念

  1. Near RealTime: 近实时;秒级别
  2. Cluster: 集群;集群中的 Node 由配置文件设置,一开始一个集群仅有一个 Node
  3. Node: 节点;集群的单元,拥有一个默认名称(运维使用),默认加入一个名称为 elasticsearch 的集群
  4. Document&field: 文档和字段;Document 是 es 中的最小数据单元,属性为文档的一个字段
  5. Index:索引;一类近似结构的 Document 数据,可以包含多个 Type 的数据
  6. Type: 类型;一类相同结构的 Document 数据
  7. Shard: 分片;es 将所有 Index 的数据切分为多个 shard,提高吞吐量,并且可以横向部署;每个 shard 都是一个 lucene index
    1. 又称为 primary shard,主分片
    2. 7.3 默认1个;仅在建立索引时一次建立,无法修改
  8. Replic: 副本;Shard 可能宕机,可以为 Shard 挂载多个 Replic,避免数据丢失和提高吞吐量
    1. 又称为 replic shard,从分片
    2. 默认一个 primary shard 搭配 1 个 replic shard
    3. 即默认一个 Index 有 count(primary_shard) 2 个 shard; *两台服务器才高可用