全文搜索属于最常见的需求,开源的 Elasticsearch (以下简称 Elastic)是目前全文搜索引擎的首选。它可以快速地储存、搜索和分析海量数据。
Elastic 的底层是开源库 Lucene。但是,你没法直接用 Lucene,必须自己写代码去调用它的接口。Elastic 是 Lucene 的封装,提供了 REST API 的操作接口,开箱即用。

基本概念

Index(索引)

Elastic 会索引所有字段,经过处理后写入一个反向索引(Inverted Index)。查找数据的时候,直接查找该索引。
所以,Elastic 数据管理的顶层单位就叫做 Index(索引)。它是单个数据库的同义词。每个 Index (即数据库)的名字必须是小写。

  • 动词,相当于mysql的insert
  • 名词,相当于mysql的database

    Type(类型)

    在 Index(索引)中,可以定义一个或多个类型。
    类似于 MySQL 的 Table,每一种类 型的数据存放在一起。

在Elasticsearch6.0之后,Type 类型被移除。
image.png

Document(文档)

保存在某个 Index(索引)下,某种 Type(类型)的一个数据,Document(文档)是JSON格式的,Document 就像是 MySQL 中某个 Table 里面每一行的数据,字段就是Document里的属性。
image.png

倒排索引

image.png

Docker安装Elasticsearch、Kibana

1. 下载镜像文件

  1. # 存储和检索数据
  2. docker pull elasticsearch:7.4.2
  3. # 可视化检索数据
  4. docker pull kibana:7.4.2

2. 配置挂载数据文件夹

  1. # 创建配置文件目录
  2. mkdir -p /mydata/elasticsearch/config
  3. # 创建数据目录
  4. mkdir -p /mydata/elasticsearch/data
  5. # 将/mydata/elasticsearch/文件夹中文件都可读可写
  6. chmod -R 777 /mydata/elasticsearch/
  7. # 配置任意机器可以访问 elasticsearch
  8. echo "http.host: 0.0.0.0" >/mydata/elasticsearch/config/elasticsearch.yml

3. 启动Elasticsearch

命令后面的 \是换行符,注意前面有空格

  1. docker run --name elasticsearch -p 9200:9200 -p 9300:9300 \
  2. -e "discovery.type=single-node" \
  3. -e ES_JAVA_OPTS="-Xms64m -Xmx512m" \
  4. -v /mydata/elasticsearch/config/elasticsearch.yml:/usr/share/elasticsearch/config/elasticsearch.yml \
  5. -v /mydata/elasticsearch/data:/usr/share/elasticsearch/data \
  6. -v /mydata/elasticsearch/plugins:/usr/share/elasticsearch/plugins \
  7. -d elasticsearch:7.4.2
  • -p 9200:9200 -p 9300:9300:向外暴露两个端口,9200用于HTTP REST API请求,9300 ES 在分布式集群状态下 ES 之间的通信端口;
  • -e "discovery.type=single-node":es 以单节点运行
  • -e ES_JAVA_OPTS="-Xms64m -Xmx512m":设置启动占用内存,不设置可能会占用当前系统所有内存
  • -v:挂载容器中的配置文件、数据文件、插件数据到本机的文件夹;
  • -d elasticsearch:7.6.2:指定要启动的镜像

访问 IP:9200 看到返回的 json 数据说明启动成功。
image.png

4. 设置 Elasticsearch 随Docker启动

  1. # 当前 Docker 开机自启,所以 ES 现在也是开机自启
  2. docker update elasticsearch --restart=always

5. 启动可视化Kibana

  1. docker run --name kibana \
  2. -e ELASTICSEARCH_HOSTS=http://192.168.163.131:9200 \
  3. -p 5601:5601 \
  4. -d kibana:7.4.2

-e ELASTICSEARCH_HOSTS=``http://192.168.163.131:9200: 这里要设置成自己的虚拟机IP地址
浏览器输入192.168.163.131:5601 测试:
image.png

6. 设置 Kibana 随Docker启动

  1. # 当前 Docker 开机自启,所以 kibana 现在也是开机自启
  2. docker update kibana --restart=always