E数据源头部分

  1. 涉及哪些业务流程,有些什么系统

  2. 系统的数据库及版本有哪些,读写分离的情况,数据库大小及负载情况

  3. 是否有源数据字典,单表条数及大小大约在什么量级

  4. 主要表是否具备数据更新时间字段

  5. 现有数据管道或ETL工具是什么

T数据构建部分

  1. 现有数据仓库采用的什么技术平台

  2. 现有数据仓库的构建规范、方法

  3. 是否已有数据开发工具、任务调度平台、调度任务监控工具

  4. 对云数仓的接受程度,对开源工具和平台的接受程度

  5. 对自建数仓可能的IT团队资源情况

L数据消费部分

  1. 主要的消费业务部门

  2. 数据消费的主要需求,如:数据跨部门拉通,指标规范统一,性能提升,数据治理……

  3. 数据消费的粒度,如:公司级汇总指标,员工级明细台账,交易级原始明细……

  4. 数据消费的最低高频率,如:秒级、分钟级、小时级、半天、一天

  5. 现有数据服务采用的什么技术平台

  6. 对项目的预期成果描述