ASCII Folding Token Filter(ASCII Folding 词元过滤器)
译文链接 : http://www.apache.wiki/pages/viewpage.action?pageId=10027030
贡献者 : fucker,ApacheCN,Apache中文网
asciifolding 类型的词元过滤器,将不在前127个ASCII字符(“基本拉丁文”Unicode块)中的字母,数字和符号Unicode字符转换为ASCII等效项(如果存在)。
例如:
"index" : {"analysis" : {"analyzer" : {"default" : {"tokenizer" : "standard","filter" : ["standard", "asciifolding"]}}}}
接受默认为 false 的 preserve_original 设置,但如果为 true ,则将保留原始 token 并发出 folded token。
例如:
"index" : {"analysis" : {"analyzer" : {"default" : {"tokenizer" : "standard","filter" : ["standard", "my_ascii_folding"]}},"filter" : {"my_ascii_folding" : {"type" : "asciifolding","preserve_original" : true}}}}
