Lowercase Token Filter(Lowercase 词元过滤器)
原文链接 : https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-lowercase-tokenfilter.html
译文链接 : http://www.apache.wiki/pages/viewpage.action?pageId=10027085
贡献者 : fucker,ApacheCN,Apache中文网
lowercase 类型的词元过滤器,将词元文本规范化为小写。
Lowercase Token Filter 通过 language 参数支持 Greek (希腊语),Irish (爱尔兰语)和 Turkish(土耳其)小写词元过滤器。 以下是自定义分词器中的使用示例
index :analysis :analyzer :myAnalyzer2 :type : customtokenizer : myTokenizer1filter : [myTokenFilter1, myGreekLowerCaseFilter]char_filter : [my_html]tokenizer :myTokenizer1 :type : standardmax_token_length : 900filter :myTokenFilter1 :type : stopstopwords : [stop1, stop2, stop3, stop4]myGreekLowerCaseFilter :type : lowercaselanguage : greekchar_filter :my_html :type : html_stripescaped_tags : [xxx, yyy]read_ahead : 1024
