1、数据血缘分析-基础
1.1、数据血缘分析-概述
1、血缘分析是保证数据融合的一个手段,通过血缘分析实现数据融合处理的可追溯性; 1.1、任何的数据,从产生、ETL处理、加工、融合、流转,到最终消亡,数据之间自然会形成一种关系。
1.2、数据血缘分析-应用场景
1、在数据的处理过程中,从数据源头到最终的数据生成,每个环节都可能会导致我们出现数据质量的问题。
1.2.1、数据的特有特征
1、归属性:特定的数据归属特定的组织(或个人),数据具有归属性。 2、多源性:同一个数据可以有多个来源, 一个数据可以是多个数据经过加工而生成的,而且这种加工过程可以是多个。 3、可追溯性: 数据的血缘关系,体现了数据的生命周期,体现了数据从产生到消亡的整个过程,具备可追溯性。 4、层次性: 数据的血缘关系是有层次的。对数据的分类、归纳、总结等对数据进行的描述信息又形成了新的数据,不同程度的描述信息形成了数据的层次。
1.3、数据血缘-关系层次
1、数据血缘-关系层次:数据所有者、数据库、表、字段、 1.1、
