最重要的查询

虽然 Elasticsearch 自带了很多的查询,但经常用到的也就那么几个。我们将在 深入搜索 章节详细讨论那些查询的细节,接下来我们对最重要的几个查询进行简单介绍。

match_all 查询

match_all 查询简单的匹配所有文档。在没有指定查询方式时,它是默认的查询:

  1. { "match_all": {}}

拷贝为 curl在 Sense 中查看

它经常与 filter 结合使用—例如,检索收件箱里的所有邮件。所有邮件被认为具有相同的相关性,所以都将获得分值为 1 的中性 _score

match 查询

无论你在任何字段上进行的是全文搜索还是精确查询,match 查询是你可用的标准查询。

如果你在一个全文字段上使用 match 查询,在执行查询前,它将用正确的分析器去分析查询字符串:

  1. { "match": { "tweet": "About Search" }}

拷贝为 curl在 Sense 中查看

如果在一个精确值的字段上使用它,例如数字、日期、布尔或者一个 not_analyzed 字符串字段,那么它将会精确匹配给定的值:

  1. { "match": { "age": 26 }}
  2. { "match": { "date": "2014-09-01" }}
  3. { "match": { "public": true }}
  4. { "match": { "tag": "full_text" }}

拷贝为 curl在 Sense 中查看

对于精确值的查询,你可能需要使用 filter 语句来取代 query,因为 filter 将会被缓存。接下来,我们将看到一些关于 filter 的例子。

不像我们在 轻量 搜索 章节介绍的字符串查询(query-string search), match 查询不使用类似 +user_id:2 +tweet:search 的查询语法。它只是去查找给定的单词。这就意味着将查询字段暴露给你的用户是安全的;你需要控制那些允许被查询字段,不易于抛出语法异常。

multi_match 查询

multi_match 查询可以在多个字段上执行相同的 match 查询:

  1. {
  2. "multi_match": {
  3. "query": "full text search",
  4. "fields": [ "title", "body" ]
  5. }
  6. }

拷贝为 curl在 Sense 中查看

range 查询

range 查询找出那些落在指定区间内的数字或者时间:

  1. {
  2. "range": {
  3. "age": {
  4. "gte": 20,
  5. "lt": 30
  6. }
  7. }
  8. }

拷贝为 curl在 Sense 中查看

被允许的操作符如下:

  • **gt**
    大于
  • **gte**
    大于等于
  • **lt**
    小于
  • **lte**
    小于等于

term 查询

term 查询被用于精确值匹配,这些精确值可能是数字、时间、布尔或者那些 not_analyzed 的字符串:

  1. { "term": { "age": 26 }}
  2. { "term": { "date": "2014-09-01" }}
  3. { "term": { "public": true }}
  4. { "term": { "tag": "full_text" }}

拷贝为 curl在 Sense 中查看

term 查询对于输入的文本不 分析 ,所以它将给定的值进行精确查询。

terms 查询

terms 查询和 term 查询一样,但它允许你指定多值进行匹配。如果这个字段包含了指定值中的任何一个值,那么这个文档满足条件:

  1. { "terms": { "tag": [ "search", "full_text", "nosql" ] }}

拷贝为 curl在 Sense 中查看

term 查询一样,terms 查询对于输入的文本不分析。它查询那些精确匹配的值(包括在大小写、重音、空格等方面的差异)。

exists 查询和 missing 查询

exists 查询和 missing 查询被用于查找那些指定字段中有值 (exists) 或无值 (missing) 的文档。这与SQL中的 IS_NULL (missing) 和 NOT IS_NULL (exists) 在本质上具有共性:

  1. {
  2. "exists": {
  3. "field": "title"
  4. }
  5. }

拷贝为 curl在 Sense 中查看

这些查询经常用于某个字段有值的情况和某个字段缺值的情况。

组合多查询

通过混合布尔查询,我们可以在我们的查询请求中灵活地编写 scoring 和 filtering 查询逻辑。

可以用 bool 查询来将多查询组合在一起,成为用户自己想要的布尔查询。它接收以下参数:

  • **must**
    文档 必须 匹配这些条件才能被包含进来。
  • **must_not**
    文档 必须不 匹配这些条件才能被包含进来。
  • **should**
    如果满足这些语句中的任意语句,将增加 _score ,否则,无任何影响。它们主要用于修正每个文档的相关性得分。
  • **filter**
    必须 匹配,但它以不评分、过滤模式来进行。这些语句对评分没有贡献,只是根据过滤标准来排除或包含文档。
  1. GET aicare_nlu/_search
  2. {
  3. "query": {
  4. "bool": {
  5. "must": { "match": { "title": "how to make millions" }},
  6. "must_not": { "match": { "tag": "spam" }},
  7. "should": [
  8. { "match": { "tag": "starred" }},
  9. { "match": { "title": "how to make millions" }}
  10. ],
  11. "filter": {
  12. "range": { "date": { "gte": "2014-01-01" }}
  13. }
  14. }
  15. }

根据条件删除数据

  1. POST /index/_delete_by_query
  2. {
  3. "query":{
  4. "match":{
  5. "second":"28"
  6. }
  7. }
  8. }

参考

Elasticsearch: 权威指南