Apache Lucene

1.1 用 Elasticsearch 解决搜索问题

1.1.1 提供快速查询

倒排索引.

image.png

相关性:

  • 关键词匹配的文档数越多, 相关性越低

1.1.2 确保结果的相关性

相关性得分 (relevancy scorre)

  • 如果某个关键词在某个文档中出现频率较高, 那么相关性更高

image.png

文档相关性得分算法: TF-IDF (term frequency-inverse document frequency, 词频-逆文档频率)

image.png

1.1.3 超越精确匹配

1. 处理错误的拼写

模糊查询

2. 支持变体

  • 英文变体
  • 高亮

3. 使用统计信息

4. 给予自动提示

1.2 探索典型的 Elasticsearch 使用案例

1.2.1 将 Elasticsearch 作为主要的后端系统

Elasticsearch 不支持事务.

image.png

1.2.2 将 Elasticsearch 添加到现有的系统

让现有模块和 Elasticsearch 协同工作.

  • 同步

image.png

1.2.3 将 Elasticsearch 和现有工具一同使用

image.png

1.2.4 Elasticsearch 的主要特性

1.2.5 扩展 Lucene 的功能

image.png

1.2.6 在 Elasticsearch 中组织数据

文档.

1.2.7 安装 Java 语言

1.2.8 下载并启动 Elasticsearch

1.2.9 验证是否工作

端口:

  • 9200: REST API
  • 9300: 节点间通信

http://127.0.0.1:9200

1.3 小结