来源:https://mp.weixin.qq.com/s?__biz=MzIwNDI0ODY1OA==&mid=2655964775&idx=1&sn=e3de7b0b24795df2ffbe254d8c2eb345&chksm=8d796d5aba0ee44c85dc210474f2dd0ff9fd0c6b794ba05f7facbe7ba1905c28dc842fffe11f&cur_album_id=2784855100346499074&scene=189#wechat_redirect

01 数据治理体系

数据治理体系内容从两个维度来看:
1)数据治理难点痛点:数据脉络不清晰、数据汇聚能力不足、数据管控能力薄弱、数据治理体系不完善、开放形式不完善。
2)数据治理5个核心:理、聚、管、治、用。
数据治理体系完整指南(全) - 图1

数据治理体系主要包含内容有数据标准、元数据、数据建模、数据集成、数据生命周期、数据质量、数据开放、数据安全及数据应用。
数据治理体系完整指南(全) - 图2
详见:数据治理体系建设与数据资产路线图规划

02 元数据

2.1、元数据解决的问题

有什么数据 - 数据是什么 - 来自何处 - 如何流转 - 谁可以访问
其本质也是一种数据,,开展元数据管理工作是开展数据资产管理的基础。

2.2、元数据分类

业务元数据:描述数据系统中业务领域相关概念、关系和规则的数据;包括业务术语、信息分类、指标、统计口径等。(从业务角度描述的)
技术元数据:描述数据系统中技术领域相关的概念、关系和规则的数据;包括数据平台内对象和数据结构的定义、源数据到目的数据的映射、数据转换加工过程的描述等。
管理元数据:描述数据系统中管理领域相关概念、关系、规则的数据;主要包括人员角色、岗位职责、管理流程等信息。

2.3、元数据模型成熟度

1、第一阶段:需要手动管理元数据,即在数据治理流程外需要额外增加的步骤。
2、第二阶段:在数据探查阶段自动生成元数据。
3、第三阶段:自动构建数据流转元数据。
数据治理体系完整指南(全) - 图3

2.4、元数据建设目标和管理手段

数据治理体系完整指南(全) - 图4
详见:元数据管理—企业数据治理的基础

2.5元数据管理

元数据管理方法:
数据治理体系完整指南(全) - 图5

元数据管理能力:
数据治理体系完整指南(全) - 图6

03 数据标准

常见的数据标准包含基础数据标准和指标数据标准。

数据治理体系完整指南(全) - 图7
主要构成:业务定义+管理信息+技术属性
数据治理体系完整指南(全) - 图8
数据标准包含内容包括:主题&分类+标注属性+标准代码
数据治理体系完整指南(全) - 图9

3.2.2、数据标准类型(举例)

不同行业的标准不同,这里仅是举例说明。
image.png
如:性别、身份证、金额、手机号码、行业、级别的分级分类的代码等

3.3、数据标准管理体系涉及思路

数据标准来源于业务,服务于业务。

依据已有标准进行建设

image.png
基础类数据标准:业务化视角
指标类数据标准:从管理角度出发
image.png
数据标准的制定是一个以业务管理为主导、外部要求为依据、企业现状为基础的兼容过程。
image.png

3.4、数据标准架构体系

通过统一标准和架构规范,统一指标、统一术语、统一模型、统一信息项,解决数据口径解释不清晰、业务和数据理解不一致等问题,实现数据在架构层面的统一
image.png
但并非所有基础类数据都要建立标准,纳入标准的数据项需要满足共享性、重要性和可行性的准入原则。

3.5、管理类数据标准建设原则

定义:分析类数据标准的业务含义和所适用的业务场景保持一致。
口径:分析类数据标准的业务取值范围、计算方法和编码规则等业务规则保持一直。
名称:分析类数据标准中文名称和英文名称均采用统一命名规则,表示相同业务含义的信息项名称应保持一直。
参照:各分析类数据标准项标准化时参考的外部标准(包括国际标准、国家标准和行业标准),内部业务制度和业务规范应保持一致。
来源:每个分析类数据标准都应有权威的来源系统;其他系统使用该信息时应直接取用权威系统结果,以保持一致。
数据治理体系完整指南(全) - 图15
以下为某企业数据标准体系框架示例,分为基础类数据标准和管理类数据标准

数据治理体系完整指南(全) - 图16

3.6、数据标准生命周期管理

数据治理体系完整指南(全) - 图17
详见:数据治理:数据标准管理的内容和实践!

04 数据建模

4.1、概念

企业级数据模型建设方法:从全局入手,涉及标准化数据模型,构建统一的数据模型管控体系,丰富和完善数据实体相关属性信息,梳理数据实体之间的逻辑关系,最终形成不同主题域数据模型。
数据治理体系完整指南(全) - 图18

4.2、数据模型分类

数据治理体系完整指南(全) - 图19

4.3、数据模型生命周期

数据治理体系完整指南(全) - 图20

4.4、案例

数据治理体系完整指南(全) - 图21
详见:8000字,详解数据建模的方法、模型、规范和工具!

05 数据集成

5.1、概念

数据集成:主要是指基于企业分散的信息系统的业务数据进行再集中、再统一管理的过程,是一个渐进的过程,主要有新的、不同的数据产生,就不断有数据集成的步骤和方案执行。数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机的集中,从而为企业数据共享提供基础支撑。
数据治理体系完整指南(全) - 图22

5.2、数据集成整体架构

数据治理体系完整指南(全) - 图23
详见:数据治理:数据集成的关键技术

06 数据生命周期

6.1、阶段划分

按照两个大的阶段来划分:数据治理规划阶段+数据生命周期管理阶段

数据治理体系完整指南(全) - 图24
数据治理规划阶段

  • 业务规划定义阶段:业务规划、业务标准设计
  • 应用设计实现阶段:数据模型设计、应用标准设计、应用设计实现、数据录入

数据生命周期管理阶段

  • 数据创建:利用数据模型保证数据完整、执行数据标准保证数据准确、加入数据质量检查创建准确、保证数据在合理的系统生成;
  • 数据使用:利用元数据监控数据使用、利用数据标准保证数据准确、利用数据质量检查加工准确、确保数据在合理的系统使用、控制数据的派生;
  • 数据归档:利用评估手段保证归档时机、分数据类型规档数据;
  • 数据销毁:利用评估手段保证数据销毁时机,分数据类型销毁数据。

要求

  • 满足对历史数据查询相关政策和管理制度的要求
  • 满足业务操作和管理分析的需要
  • 满足审计管理要求
  • 减少数据冗余,提高数据一致性
  • 存储、硬件、运维等方面基础设施投入
  • 提升应用系统性能,提高响应速度

    6.2、管理要求和手段

    数据治理体系完整指南(全) - 图25

    6.3、管理规范和管理办法

    数据治理体系完整指南(全) - 图26

    07 数据质量

    7.1、数据质量管理目标

  1. 根据数据消费者的需求,开发一种满足数据质量要求的管理方法
  2. 定义数据质量控制的标准和规范,并作文整个数据生命周期的一部分
  3. 定义和事实测量、监控和报告数据质量水平的过程
  4. 根据数据消费者要求,通过改变流程和系统,以及参与可显著改善数据质量的活动,识别和倡导提高数据质量的机会

    7.2、生命周期

  • 计划阶段:数据质量团队评估已知的问题范围、影响和优先级,并评估解决这些问题的备选方案。
  • 执行计划:数据质量团队负责努力解决引起问题的根本原因,并做出对持续监控数据的计划(技术问题、流程问题)。
  • 检查阶段:这一阶段包括积极监控按要求评测的数据质量。
  • 处理阶段:处理和解决新出现的数据质量问题的活动。

    7.3、数据质量维度

    数据治理体系完整指南(全) - 图27
    详见:数据质量管理之根因分析!

7.4、数据质量常用工具

数据治理体系完整指南(全) - 图28

08 数据开发

围绕数据价值通道(数据资产 -> 数据服务 -> 业务应用)来设计数据开发的全流程管理,推动数据价值的释放。
数据治理体系完整指南(全) - 图29

8.1、数据资产

数据资产的应用实现方式,打通基础数据链条,实现联通协同,提升数据价值

数据治理体系完整指南(全) - 图30
数据资产生命周期:注册、变更、监控、下线
数据治理体系完整指南(全) - 图31
详见:数据管理、数据治理、数据资产管理,到底有何不同?

8.2、数据服务

数据治理体系完整指南(全) - 图32
数据服务技术架构:
数据治理体系完整指南(全) - 图33
详见:为什么说 数据服务是数据中台的标配?

09 数据安全

数据安全体系包含:数据安全技术体系+安全管理体系+安全运营体系

数据治理体系完整指南(全) - 图34
详见:数据安全治理体系建设思路和方法

10 ETL

10.1、含义

数据治理体系完整指南(全) - 图35
数据治理体系完整指南(全) - 图36
数据治理体系完整指南(全) - 图37

10.2、ETL模式

数据治理体系完整指南(全) - 图38

触发器模式:

数据治理体系完整指南(全) - 图39

增量字段模式:

数据治理体系完整指南(全) - 图40

全量同步模式:

数据治理体系完整指南(全) - 图41

日志对比模式:

数据治理体系完整指南(全) - 图42

不同模式的对比:

数据治理体系完整指南(全) - 图43
详见:ETL与数仓建模!

10.3、离线和实时

实时数据:

数据治理体系完整指南(全) - 图44
数据治理体系完整指南(全) - 图45
离线数据:
数据治理体系完整指南(全) - 图46
数据治理体系完整指南(全) - 图47
使用场景:
数据治理体系完整指南(全) - 图48
详见:实时数仓VS离线数仓