1、什么是partial update(部分更新)?

PUT /index/_doc/id,创建文档&替换文档,就是一样的语法
一般对应到应用程序中,每次的执行流程基本是这样的:
(1)应用程序先发起一个get请求,获取到document,展示到前台界面,供用户查看和修改
(2)用户在前台界面修改数据,发送到后台
(3)后台代码,会将用户修改的数据在内存中进行执行,然后封装好修改后的全量数据
(4)然后发送PUT请求,到es中,进行全量替换
(5)es将老的document标记为deleted,然后重新创建一个新的document
partial update(部分更新)

  1. post /index/_doc/id/_update
  2. {
  3. "doc": {
  4. "要修改的少数几个field即可,不需要全量的数据"
  5. }
  6. }

看起来,好像就比较方便了,每次就传递少数几个发生修改的field即可,不需要将全量的document数据发送过去

2、图解partial update实现原理以及其优点

内部原理
看起来,好像partial update比较方便,每次就传递少数几个发生修改的field即可,不需要将全量的document数据发送过去,那他是指上的内部原理又是什么呢?
其实es内部对partial update的实际执行和传统的全量替换方式是几乎一样的,其步骤如下

  1. 内部先获取到对应的document;
  2. 将传递过来的field更新到document的json中(这一步实质上也是一样的);
  3. 将老的document标记为deleted(到一定时候才会物理删除);
  4. 将修改后的新的document创建出来

partial update相比较全量替换的优点:

  • 所有从查询、修改和写回操作都是发生在es中的一个shard内部(一瞬间就完成,可能基本上是毫秒级别的),避免了所有的网络数据传输的开销,大大提升了性能;
  • 减少了查询和修改中的时间间隔,可以有效减少并发冲突的情况;

image

3、上机动手实战演练partial update

PUT /test_index/_doc/10
{
  "test_field1": "test1",
  "test_field2": "test2"
}
POST /test_index/_update/10
{
  "doc":{
    "test_field2": "test2eddddddee"
  }
}