Elasticsearch的速度已经很快了,但甚至能更快。将多个请求合并成一个,避免单独处理每个请求花费的网络延时和开销。如果你需要从Elasticsearch检索很多文档,那么使用mulit-get 或者mget API来将这些检索请求放在一个请求中,将比逐个文档请求更快的检索到全部文档。
mget API要求有一个docs 数组作为参数,每个元素包含需要检索文档的元数据,包括_index、_type和 _id 。如果你想检索一个或者多个特定的字段,那么你可以通过_source 参数来指定这些字段的名字:
GET /_mget{"docs" : [{"_index" : "website","_type" : "blog","_id" : 2},{"_index" : "website","_type" : "pageviews","_id" : 1,"_source": "views"}]}
该响应体也包含一个docs 数组,对于每一个在请求中指定的文档,这个数组都包含有一个对应的响应,且顺序与请求中的顺序相同。其中的每一个响应都和使用单个 get request 请求所得到的响应体相同:
{
"docs" : [
{
"_index" : "website",
"_id" : "2",
"_type" : "blog",
"found" : true,
"_source" : {
"text" : "This is a piece of cake...",
"title" : "My first external blog entry"
},
"_version" : 10
},
{
"_index" : "website",
"_id" : "1",
"_type" : "pageviews",
"found" : true,
"_version" : 2,
"_source" : {
"views" : 2
}
}
]
}
如果想检索的数据都在相同的_index中(甚至相同的 _type中),则可以在URL中指定默认地/_index 或者默认地 /_index/_type。
你仍然可以通过单独请求覆盖这些值
GET /website/blog/_mget
{
"docs" : [
{ "_id" : 2 },
{ "_type" : "pageviews", "_id" : 1 }
]
}
事实上,如果所有文档的_index 和 _type 都是相同的,你可以只传一个ids 数组,而不是整个docs数组:
GET /website/blog/_mget
{
"ids" : [ "2", "1" ]
}
注意,我们请求的第二个文档是不存在的。我们指定类型为blog。但是文档ID1 的类型是pageviews,这个不存在的情况将在响应体中被报告:
{
"docs" : [
{
"_index" : "website",
"_type" : "blog",
"_id" : "2",
"_version" : 10,
"found" : true,
"_source" : {
"title": "My first external blog entry",
"text": "This is a piece of cake..."
}
},
{
"_index" : "website",
"_type" : "blog",
"_id" : "1",
"found" : false //1
}
]
}
1.未找到该文档
事实上第二个文档未能找到并不妨碍第一个文档被检索到。每个文档都是单独检索和报告的。
NOTE
即使有某个文档没有找到,上述请求的HTTP状态码仍然是200。事实上,即使请求没有找到任何文档,他的状态码依然是200—因为mget请求本身已经执行成功。为了确定某个文档查找是成功或者失败,你需要检查found 标记。
