技术:

  1. 数据收集层:离线dataX、实时cannal、flume
  2. 数据存储层:hdfs
  3. 数据计算层:spark sql、presto
  4. 数据应用层:superset可视化、clickhouse、starRocks
  5. 调度系统:azkaban、DolphinScheduler
  6. 集群监控:集群硬件监控zabbix、日志收集
  7. 元数据管理:atlas
  8. 权限管理:kerberos+LDAP+ranger
  9. 数据质量:shell+sql、griffin

业务&管理:

指标体系:指标定义与体系、埋点规范与体系
模型规范:数仓分层
开发规范:代码规范

工作流程规范:需求管理、项目管理-迭代周期
岗位职责规范:单岗位职责清晰、多岗位互相协作

image.png
image.png