image.png
    对于数据库一般基于ID去创建索引然后形成B+Tree
    那么去解搜的速度就会非常快(正向索引):
    在做局部内容解搜的时候性能非常差

    倒排索引:
    image.png
    总结:
    什么是文档和词条?
    文档:
    我们的每一行的数据(网页,订单)
    词条:
    对文档中的内容分词,得到词语就是词条
    中文按照语意分,英文按照空格分
    什么是正向索引?
    根据id生成的索引。查询词条时
    必须先找到文档,而后判断是否是包
    含词条
    什么是倒排索引?
    对文档内容分词 对词条创建索引
    并记录词条所在文档的信息 查询时先根据
    词条查询到文档id 而后获取到文档