https://github.com/medcl/elasticsearch-analysis-pinyin

    keep_first_letter : 首字母小写,例如:刘德华> ldh,默认值:true
    keep_separate_first_letter: 是否拆分第一个字母, 例如:刘德华> l,d,h 默认:false
    limit_first_letter_length: 限制一个长词的各字拼音首字母连起来的最大长度 比如”马牛逼爱吃屎” 当参数位置为3时 只会保留 mnb

    keep_full_pinyin:是否保留全拼 刘德华> [ liu,de,hua] 默认true

    keep_joined_full_pinyin 例如:刘德华> [liudehua] 默认 false 这个参数需要注意是否有必要主动设置为true

    keep_none_chinese 当与英文混合时,是否保留英文 默认true

    keep_none_chinese_together 保持非中文的在一块儿 默认true 例如 DJ音乐家- > DJ,yin,yue,jia
    设置为false时 DJ音乐家- > D,J,yin,yue,jia , 注意:keep_none_chinese必须先设置为true

    keep_none_chinese_in_first_letter 例子:刘德华AT2016->ldhat2016 注意: 大部分查询场景中都是针对中文拼音的搜索,如果将non chinese字符也涵盖进来,容易搜错。 建议主动设置为false 比如实际搜索 ldh 2016 就不行

    none_chinese_pinyin_tokenize 例子:liudehuaalibaba13zhuanghan- > liu,de,hua,a,li,ba,ba,13,zhuang,han 默认值true 注意: keep_none_chinese和keep_none_chinese_together应首先启用 建议最好最好设置为false

    image.png

    keep_original 当启用此选项时,也将保留原始输入,默认值:false 看具体业务逻辑是否保留

    lowercase : 小写非中文字母,默认值:true

    trim_whitespace : 默认值:true 根据空格来分

    remove_duplicated_term: 当启用此选项时,将删除重复项以保存索引,例如:de的> de,默认值:false注意:位置相关查询可能受影响