参考:https://www.elastic.co/guide/cn/elasticsearch/guide/current/analysis-intro.html
    分析 包含下面的过程:

    • 首先,将一块文本分成适合于倒排索引的独立的词条
    • 之后,将这些词条统一化为标准格式以提高它们的“可搜索性”,或者 recall


    分析器执行上面的工作。
    分析器 实际上是将三个功能封装到了一个包里:
    字符过滤器
    字符串按顺序通过每个
    字符过滤器 。他们的任务是在分词前整理字符串。一个字符过滤器可以用来去掉HTML,或者将 & 转化成 and
    分词器
    其次,字符串被
    分词器 分为单个的词条。一个简单的分词器遇到空格和标点的时候,可能会将文本拆分成词条。
    Token 过滤器
    最后,词条按顺序通过每个 _token 过滤器
    。这个过程可能会改变词条(例如,小写化 Quick ),删除词条(例如, 像 aandthe 等无用词),或者增加词条(例如,像 jumpleap 这种同义词)。
    **