特点
- 分布式
- lucene ,只能单机
- 搜索
- 数据分析
功能
- 全文搜索
- 数据分析
- 结构化检索
- 对数据的近实时(Near RealTime)处理
- 秒级别,非离线批处理
概念
- Near RealTime: 近实时;秒级别
- Cluster: 集群;集群中的 Node 由配置文件设置,一开始一个集群仅有一个 Node
- Node: 节点;集群的单元,拥有一个默认名称(运维使用),默认加入一个名称为 elasticsearch 的集群
- Document&field: 文档和字段;Document 是 es 中的最小数据单元,属性为文档的一个字段
- Index:索引;一类近似结构的 Document 数据,可以包含多个 Type 的数据
- Type: 类型;一类相同结构的 Document 数据
- Shard: 分片;es 将所有 Index 的数据切分为多个 shard,提高吞吐量,并且可以横向部署;每个 shard 都是一个 lucene index
- 又称为 primary shard,主分片
- 7.3 默认1个;仅在建立索引时一次建立,无法修改
- Replic: 副本;Shard 可能宕机,可以为 Shard 挂载多个 Replic,避免数据丢失和提高吞吐量
- 又称为 replic shard,从分片
- 默认一个 primary shard 搭配 1 个 replic shard
- 即默认一个 Index 有 count(primary_shard) 2 个 shard; *两台服务器才高可用