Stop Analyzer

原文链接 : https://www.elastic.co/guide/en/elasticsearch/reference/5.3/analysis-stop-analyzer.html(修改该链接为官网对应的链接)

译文链接 : http://www.apache.wiki/pages/viewpage.action?pageId=10027822(修改该链接为 ApacheCN 对应的译文链接)

贡献者 : ╮欠n1的太多ApacheCNApache中文网

Stop Analyzer(停止分词器)是一样的simple分析 ,但增加了对移除停止字的支持。它默认使用_english_停止词。

输出示例

  1. POST _analyze
  2. {
  3. "analyzer": "stop",
  4. "text": "The 2 QUICK Brown-Foxes jumped over the lazy dog's bone."
  5. }

上述示例产生以下术语:

  1. [ quick, brown, foxes, jumped, over, lazy, dog, s, bone ]

配置

停止分词器接受以下参数:

stopwords 预定义的停止词列表,如english或包含停止词列表的数组。 默认为english
stopwords_path 包含停止词的文件的路径。此路径是相对于Elasticsearch config目录。

有关停止字配置的更多信息,请参阅Stop Token Filter

配置示例

在本例中,我们将stop分析器配置为使用指定的单词列表作为停止词:

  1. PUT my_index
  2. {
  3. "settings": {
  4. "analysis": {
  5. "analyzer": {
  6. "my_stop_analyzer": {
  7. "type": "stop",
  8. "stopwords": ["the", "over"]
  9. }
  10. }
  11. }
  12. }
  13. }
  14. POST my_index/_analyze
  15. {
  16. "analyzer": "my_stop_analyzer",
  17. "text": "The 2 QUICK Brown-Foxes jumped over the lazy dog's bone."
  18. }

上述示例产生以下术语:

  1. [ quick, brown, foxes, jumped, lazy, dog, s, bone ]