倒排索引(Inverted Index)
倒排索引的概念
字段(Term)
- Term 关键字,比如中国这个单词
- Term Index 内存中以树形式存在的索引
- 加速 对Term Dictionary的访问
- Term Dictionary
- 在磁盘上分 Block保存
- 存储Term及Posting List
Posting List(倒排记录) :存储了记录了出现过某个单词的所有文档的文档列表及单词在该文档中出现的位置信息。每条记录称为一个倒排项(Posting)
从Term Dictionary 可以获取到Term的docId和offset,那么就可以很快地找到相应的记录了