https://github.com/medcl/elasticsearch-analysis-pinyin
elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-pinyin/releases/download/v7.14.0/elasticsearch-analysis-pinyin-7.14.0.zip
参数 | 含义 | 默认值 | 备注 |
---|---|---|---|
keep_first_letter | 保留拼音首字母分词,例如:刘德华->ldh。 | true | |
keep_separate_first_letter | 拆分保留拼音首字母,例如:刘德华->l,d,h。 | false | 分词过细可能导致查询结果比较模糊 |
limit_first_letter_length | 限制首字母最大长度 | 16 | |
keep_full_pinyin | 拆分保留全拼,例如:刘德华-> [liu,de,hua] | true | |
keep_joined_full_pinyin | 合并保留全拼,例如:刘德华-> liudehua | false | |
keep_none_chinese | 保留非中文字符 | true | |
keep_none_chinese_together | 保留非中文字符,并将非中文字符放在一起。例如:当设置为true,则DJ音乐家 -> DJ,yin,yue,jia;当设置为false,DJ音乐家 -> D,J,yin,yue,jia | true | 需要先设置keep_none_chinese为true |
keep_none_chinese_in_first_letter | 将非中文字符放在首字母分词中,例如:刘德华AT2016->ldhat2016 | true | |
keep_none_chinese_in_joined_full_pinyin | 将非中文字符放在全拼分词中,例如:刘德华AT2016->liudehua2016 | false | |
none_chinese_pinyin_tokenize | 如果非中文字母是拼音的话,把它们分成单独的拼音。例如:liudehuaalibaba13zhuanghan -> liu,de,hua,a,li,ba,ba,13,zhuang,han | true | 需要先设置keep_none_chinese和keep_none_chinese_together为true |
keep_original | 在分词的同时,保留原始输入内容 | false | |
lowercase | 将非中文字符转化成小写字母 | true | |
trim_whitespace | 去除空格 | true | |
remove_duplicated_term | 删除重复的term,例如:de的>de | false | |
ignore_pinyin_offset | 6.0之后,偏移严格约束,不允许重叠的令牌,使用此参数,忽略偏移量允许重叠的令牌,请注意,所有与位置相关的查询或高亮显示将变得不正确,您应该使用多个字段,并为不同的查询目的指定不同的设置。如果您需要偏移量,请将其设置为false | true |