数据输入和输出 - 取回多个文档 - 《PHP杂项》

NOTE

Elasticsearch的速度已经很快了，但甚至能更快。将多个请求合并成一个，避免单独处理每个请求花费的网络延时和开销。如果你需要从Elasticsearch检索很多文档，那么使用mulit-get 或者mget API来将这些检索请求放在一个请求中，将比逐个文档请求更快的检索到全部文档。

mget API要求有一个docs 数组作为参数，每个元素包含需要检索文档的元数据，包括_index、_type和 _id 。如果你想检索一个或者多个特定的字段，那么你可以通过_source 参数来指定这些字段的名字：

GET /_mget
{
   "docs" : [
      {
         "_index" : "website",
         "_type" :  "blog",
         "_id" :    2
      },
      {
         "_index" : "website",
         "_type" :  "pageviews",
         "_id" :    1,
         "_source": "views"
      }
   ]
}

该响应体也包含一个docs 数组，对于每一个在请求中指定的文档，这个数组都包含有一个对应的响应，且顺序与请求中的顺序相同。其中的每一个响应都和使用单个 get request 请求所得到的响应体相同：

{
   "docs" : [
      {
         "_index" :   "website",
         "_id" :      "2",
         "_type" :    "blog",
         "found" :    true,
         "_source" : {
            "text" :  "This is a piece of cake...",
            "title" : "My first external blog entry"
         },
         "_version" : 10
      },
      {
         "_index" :   "website",
         "_id" :      "1",
         "_type" :    "pageviews",
         "found" :    true,
         "_version" : 2,
         "_source" : {
            "views" : 2
         }
      }
   ]
}

如果想检索的数据都在相同的_index中（甚至相同的 _type中），则可以在URL中指定默认地/_index 或者默认地 /_index/_type。

你仍然可以通过单独请求覆盖这些值

GET /website/blog/_mget
{
   "docs" : [
      { "_id" : 2 },
      { "_type" : "pageviews", "_id" :   1 }
   ]
}

事实上，如果所有文档的_index 和 _type 都是相同的，你可以只传一个ids 数组，而不是整个docs数组：

GET /website/blog/_mget
{
   "ids" : [ "2", "1" ]
}

注意，我们请求的第二个文档是不存在的。我们指定类型为blog。但是文档ID1 的类型是pageviews，这个不存在的情况将在响应体中被报告：

{
  "docs" : [
    {
      "_index" :   "website",
      "_type" :    "blog",
      "_id" :      "2",
      "_version" : 10,
      "found" :    true,
      "_source" : {
        "title":   "My first external blog entry",
        "text":    "This is a piece of cake..."
      }
    },
    {
      "_index" :   "website",
      "_type" :    "blog",
      "_id" :      "1",
      "found" :    false      //1
    }
  ]
}

1.未找到该文档

事实上第二个文档未能找到并不妨碍第一个文档被检索到。每个文档都是单独检索和报告的。

NOTE

即使有某个文档没有找到，上述请求的HTTP状态码仍然是200。事实上，即使请求没有找到任何文档，他的状态码依然是200—因为mget请求本身已经执行成功。为了确定某个文档查找是成功或者失败，你需要检查found 标记。