日志系统 - elasticsearch - 《运维笔记 - 教程》

来源：极客时间elasticsearch课程

Elasticsearch的主要功能：
1.海量数据的分户式存储以及集群管理：服务与数据的高可用，水平扩展
2.近实搜索，性能卓越：结构化、全文、地理位置、自动完成
3.海量数据的近实时分析：聚合功能

新特性 5.X

索引、文档偏向开发人员视角，逻辑上的概念
节点、分片偏向运维人员，物理上的概念

Elasticsearch是面向文档的，文档是所有可搜索数据的最小单位
- 日志文件中的日志项
- 一本电影的具体信息 / 一张唱片的详细信息
- MP3播放器里的一首歌 / 一篇PDF文档中的具体内容
文档会背序列化成JSON格式，保存在Elasticsearch中
- JSON对象由字段组成
- 每个字段都有对应的字段类型（字符串 / 数值 / 布尔 / 日期 / 二进制 / 范围类型）
每个文档都有一个Unique ID
- 可以指定ID
- 或者通过Elasticsearch自动生成

JSON文档

图片.png 如图，将CSV file转换为json格式的数据

文档的元数据

图片.png

图片.png
索引的不同语意

Type

传统关系型数据库和Elasticsearch的区别：

图片.png

图片.png 一些基本的API

分布式系统的可用性与扩展性

分布式特性

Elastcsearch的分布式架构的好处
- 存储的水平扩容
- 提高系统的可用性，部分节点停止服务，整个集群的服务不受影响
Elasticsearch的分布式架构
- 不同的集群通过不同的名字来区分，默认名字“elasticsearch”
- 通过配置文件修改，或者在命令行中 -E cluster.name=geektime进行设定
- 一个集群可以有一个或者多个节点
  节点
节点是一个Elasticsearch的实例
- 本质上就是一个JAVA进程
- 一台机器上可以运行多个Elasticsearch进程，但是生产环境一般建议一台机器上运行一个Elasticsearch实例
- 每一个节点都有名字，通过配置文件配置，或者启动时间 -E node.name=node1指定
- 每一个节点在启动之后，会分配一个UID，保存在data目录下

Master-eligible nodes和Master Node
图片.png
Data Node & Coordinating Node

其他的节点类型

配置节点类型

Primary Shard & Replica Shard
图片.png
分片的设定

查看集群健康状态

Demo