1、数据血缘分析-基础

1.1、数据血缘分析-概述

1、血缘分析是保证数据融合的一个手段,通过血缘分析实现数据融合处理的可追溯性; 1.1、任何的数据,从产生、ETL处理、加工、融合、流转,到最终消亡,数据之间自然会形成一种关系。

1.2、数据血缘分析-应用场景

1、在数据的处理过程中,从数据源头到最终的数据生成,每个环节都可能会导致我们出现数据质量的问题。

1.2.1、数据的特有特征

1、归属性:特定的数据归属特定的组织(或个人),数据具有归属性。 2、多源性:同一个数据可以有多个来源, 一个数据可以是多个数据经过加工而生成的,而且这种加工过程可以是多个。 3、可追溯性: 数据的血缘关系,体现了数据的生命周期,体现了数据从产生到消亡的整个过程,具备可追溯性。 4、层次性: 数据的血缘关系是有层次的。对数据的分类、归纳、总结等对数据进行的描述信息又形成了新的数据,不同程度的描述信息形成了数据的层次。

1.3、数据血缘-关系层次

1、数据血缘-关系层次:数据所有者、数据库、表、字段、 1.1、

https://blog.csdn.net/q1042960848/article/details/107386180