阿里正弃用中台…


中台

中台缘起

1. 前身 共性化平台

  • 抽象公共的功能
  • 平台间独立

    image.png
    缺点: 1, 沟通协作成本高 2,出现数据孤岛 3, 前台变化无序,后台稳定有序的冲突

    2. 中台

    前台: 和用户交互
    中台: 输出公共的, 通用的后台能力, 快速支撑前台创新
    后台: 服务, 算法, 基础设施, 数据
    image.png
    企业级共享平台,提供基础能力封装
    目标: 前台敏捷迭代,试错能力

    中台演进

    业务中台: 抽象业务能力
    数据中台: 各个业务之间打通业务数据, 汇聚多业务数据 进行加工
    更细粒度的划分: 技术,安全, 算法中台

数据中台

是各个中台的基础, 打通全局数据
目的: 共享复用, 提升开发效率, 数据服务业务
成熟数据中台的能力:

  • 汇聚全域数据
  • 构建出数据资产体系的能力
  • 数据资产的管理能力
  • 工具组件的平台化

    数据中台闭环及作用

    image.png

    数据中台的发展

  1. 传统数仓
    1. 数据支撑经营者决策
    2. 数据形态: 关系型数据库, 体量较小
    3. 技术: 商用数据库, 小型机
    4. 应用: 提供BI报表, 决策分析
  2. 数据驱动的数据湖
    1. 业务和数据深度融合
    2. 数据形态: 数据标准化
    3. 技术: Hadoop, 机器学习/深度学习
    4. 应用: 决策分析 针对性推荐,营销, 用户画像
  3. 数据中台

    1. 企业级数据共享平台
    2. 数据形态: 体系化数据资产
    3. 技术: 更通用, 更统一的数据服务体系
    4. 应用: 决策分析 针对性推荐,营销, 用户画像 + OLTP 实时交互

      架构

      数据资产
      ODS: 尽可能保证和原始数据一样
      DWD公共明细层
      DWS 公共汇总层
      image.png

      技术选型

  4. 数据的采集汇聚

    1. 日志实时采集: Flume, Filebeat
    2. 数据库实时同步工具: canal, OGG, MaxWell
    3. 离线数据交换: Sqoop(批量迁移数据的工具), DataX(高效异构同步工具)
  5. 数据存储
    1. 分布式文件系统 HDFS, Kafka, HBase/Phoenix
    2. ElasticSearch, clickHouse
  6. 计算引擎
    1. 离线计算: Spark, Hive(早期)
    2. 实时计算: Spark Structured Streaming, Flink
  7. 即席分析
    1. ROLAP关系型 : Presto, ClinkHouse, Doris
    2. MOLAP多维度: Kylin, Druid
  8. 在线查询
    1. ElasticSearch, Redis, MySQL, TiDB, HBase
  9. 数据调度 解决任务依赖
    1. Azkaban, AirFlow, DolphinScheduler

实战

需要采集的数据内容
image.png
采集方式
image.png
实时同步
举例: 手机流量的实时提醒, 电商和新闻类的实时排行, 设备的监控报警
数据库的实时同步 : 通过增量日志的捕获, 对数据库影响代价小
日志类文件同步: 访问日志, 埋点, IOT, 爬虫
image.png
离线同步
image.png
安全可靠, 可调整
周期性的定时任务

more