课程地址:https://www.imooc.com/learn/1297

image.png

数据中台之数据汇聚整合,消除数据孤岛 - 图2 简介:本课程会依次向大家介绍中台的诞生背景、数据中台的架构以及如何进行合理得技术选型,并结合一个通用的关系型数据库同步至HDFS的工具套件实现,带大家拓展了基于Spark的多源异构数据同步工具的设计思路。

第1章 中台的前世今生

本章中会依次向大家介绍,中台的系统架构是如何诞生的、各类型架构的特点和存在的问题、数据中台架构是如何解决这些问题的,以及中台的演进过程,帮助大家对中台有初步得了解。

1-1 课程介绍 (05:14)

image.png
image.png

image.png

1-2 中台的缘起 (08:09)

image.png

image.png

image.png

image.pngimage.png

image.png
image.png

1-3 中台的演进 (04:21)

image.png

image.png
image.png
image.png

第2章 数据中台体系

在本章中,首先会从数据应用的角度带大家回顾数据中台的诞生过程;然后介绍一个成熟的数据中台应该具备的核心能力,并对数据中台的架构按照模块进行分解,介绍每个模块的功能,以及各自得技术选型。

2-1 数据应用的发展阶段 (06:25)

image.png

image.png

image.png

image.png

image.png

2-2 成熟的数据中台具备的能力 (05:17)

image.png

2-3 数据中台架构 (05:20)

image.png

2-4 数据中台技术选型 (05:50)

image.png

image.png
image.png
image.png

image.png

image.png
image.png

第3章 基于Spark的多源异构数据同步套件

本章中会依次介绍数据采集、汇聚的技术架构;一个成熟的数据同步套件的架构以及具备的功能,并带领大家实现一个具备完整功能的关系型数据库同步至HDFS的工具套件,拓展基于Spark的通用的数据同步套件的设计思路。

3-1 数据采集、汇聚的技术架构 (10:40)

image.png

image.png

image.png
image.png
image.png
image.png

3-2 构建异构数据源的同步套件 (05:29)

image.png

image.png
image.png
image.png
image.png

3-3 DataX数据同步案例 (15:30)

image.png

image.png

image.png

use test

image.png

3-4 移植DataX的配置管理功能 (07:30)

3-5 配置管理的功能点代码演示 (09:32)

3-6 关系型数据库同步至HDFS的功能开发 (07:44)

3-7 同步流程抽象为三大模块 (06:04)

3-8 三大模块的整体架构实现 (11:02)

3-9 三大模块的具体功能实现 (10:29)

3-10 数据转换模块的插件化管理 (12:37)

3-11 基于Spark的数据同步套件设计思路 (04:33)

3-12 本章总结 (02:35)