总线矩阵

总线矩阵不是一步构建的,而是迭代而来的。收集业务分析需求,圈定业务主要分析方向,找出其中涉及的业务过程,然后着重建设此领域。等当前领域建设完成了,可以找出次要分析方向,按照上述流程迭代建设。

what

总线矩阵的内容:

  • 业务过程、数据域(或者叫主题)、业务过程和数据域的关系。
  • 描述业务过程:业务过程与哪些维度相关。

    why

    为什么要构建总线矩阵?
    用于沟通。总线矩阵是一个有效沟通工具,他是连接开发和业务之间的桥梁。当业务想分析某个角度时,参考此矩阵,开发人员可以方便了解业务方需求,构建数据模型。而当业务与开发存在分歧时,开发者也可以接住此矩阵和业务人员讨论沟通分歧。

    how

    image.png
    image.pngimage.png

    业务过程

    ddd业务过程定义:现实世界中,能产生数据,这些数据对于描述业务很重要,可以服务于上层的分析场景。
    举例:参考阿里中数据过程的定义。里面有的一个场景。

    主题划分

    (why)是对总线矩阵的高层次的整合,将可能的业务分析场景,提前整理出来,用于沟通。
    构建方法
  1. 从业务系统的实体考虑,将实体整合成一个主题。
  2. 从业务的整体流程,user story考虑,查看整体业务环节,针对环节构建主题。

    数仓分层

    (why)—>分层的好处
    五层结构:
    ods—>dwd—>dws—>dwt—>ads
    举例,说明分层的好处