Keep Words Token Filter(保留字过滤器)

原文链接 : https://www.elastic.co/guide/en/elasticsearch/reference/5.3/getting-started.html

译文链接 : http://www.apache.wiki/pages/viewpage.action?pageId=10028810

贡献者 : 李亚运ApacheCNApache中文网

简述

当词元过滤器中的type为keep时,表示只保留具有预定义单词集中的文本的token。可以在设置中定义一组单词,或者从包含每行一个单词的文本文件加载。

参数

| keep_words | 要保留的单词列表 | | keep_words_path | 一个文字文件的路径 | | keep_words_case | 一个布尔值,表示是否小写单词(默认为false ) |

示例

  1. PUT /keep_words_example
  2. {
  3. "settings" : {
  4. "analysis" : {
  5. "analyzer" : {
  6. "example_1" : {
  7. "tokenizer" : "standard",
  8. "filter" : ["standard", "lowercase", "words_till_three"]
  9. },
  10. "example_2" : {
  11. "tokenizer" : "standard",
  12. "filter" : ["standard", "lowercase", "words_in_file"]
  13. }
  14. },
  15. "filter" : {
  16. "words_till_three" : {
  17. "type" : "keep",
  18. "keep_words" : [ "one", "two", "three"]
  19. },
  20. "words_in_file" : {
  21. "type" : "keep",
  22. "keep_words_path" : "analysis/example_word_list.txt"
  23. }
  24. }
  25. }
  26. }
  27. }