幂等性

幂等性强调的是外界通过接口对系统内部的影响, 外界怎么看系统和幂等性没有关系，只要一次或多次调用对某一个资源应该具有同样的副作用就行。注意了，是对资源造成的副作用必须是一样的，但是返回值允许不同！

ETL处理流程重复执行并不会给系统带来不一样的副作用。此时需要保证业务逻辑是一致的。

增量加载

可通过：

来实现增量加载。

通俗讲，就是将复杂的问题拆解成更细小的执行单元。每个小的执行单元执行的是不同的任务。这样能够试开发和维护成本降低，也便于进行ETL测试。

通过对目标中摄取的数据进行分区，您可以并行化dag运行，避免对正在摄取的数据进行写锁定，并在读取相同数据时优化性能。它还将作为特定时刻数据在审计时的样子的历史快照。不再相关的分区可以存档并从数据库中删除。

使用临时表能够有助于实现ETL过程的原子化和模块化，让ETL过程变得更加灵活和便于维护。

参考：

将重复使用到的ETL处理逻辑进行模块化处理，可以有效提高开发效率和降低维护成本。Airflow的设计就遵从了这一原则。

参考：

通过保存源数据和处理过程的历史信息，有助于ETL测试，和进行数据恢复。

参考：