1、什么是partial update
(部分更新)?
PUT /index/_doc/id
,创建文档&替换文档,就是一样的语法
一般对应到应用程序中,每次的执行流程基本是这样的:
(1)应用程序先发起一个get请求,获取到document,展示到前台界面,供用户查看和修改
(2)用户在前台界面修改数据,发送到后台
(3)后台代码,会将用户修改的数据在内存中进行执行,然后封装好修改后的全量数据
(4)然后发送PUT请求,到es中,进行全量替换
(5)es将老的document标记为deleted,然后重新创建一个新的documentpartial update
(部分更新)
post /index/_doc/id/_update
{
"doc": {
"要修改的少数几个field即可,不需要全量的数据"
}
}
看起来,好像就比较方便了,每次就传递少数几个发生修改的field即可,不需要将全量的document数据发送过去
2、图解partial update
实现原理以及其优点
内部原理
看起来,好像partial update比较方便,每次就传递少数几个发生修改的field即可,不需要将全量的document数据发送过去,那他是指上的内部原理又是什么呢?
其实es内部对partial update的实际执行和传统的全量替换方式是几乎一样的,其步骤如下
- 内部先获取到对应的document;
- 将传递过来的field更新到document的json中(这一步实质上也是一样的);
- 将老的document标记为deleted(到一定时候才会物理删除);
- 将修改后的新的document创建出来
partial update相比较全量替换的优点:
- 所有从查询、修改和写回操作都是发生在es中的一个shard内部(一瞬间就完成,可能基本上是毫秒级别的),避免了所有的网络数据传输的开销,大大提升了性能;
- 减少了查询和修改中的时间间隔,可以有效减少并发冲突的情况;
3、上机动手实战演练partial update
PUT /test_index/_doc/10
{
"test_field1": "test1",
"test_field2": "test2"
}
POST /test_index/_update/10
{
"doc":{
"test_field2": "test2eddddddee"
}
}