任务列表

  • Spark离线项目实战 集群模式未测试,主要是本地集群资源不足,无法测试
  • HBase集成Phoenix二级索引组件

大数据-生态圈工具

  • Azkaban 实现企业级自动化任务开发
  • Flume 数据采集和迁移
  • Sqoop 数据采集和迁移
  • Impala 构建高性能交互式SQL分析
  • Oozie 实现企业级自动化任务开发
  • Hue构建大数据可视化分析
  • Kudu 构建高性能随机读写访问数据存储系统
  • 数据湖架构
  • [x] 技术栈-ElasticStack

    大数据-分布式数据存储

  • [ ] TiDB

  • Redis
  • HBase
  • [x] Kafka

    大数据-框架

  • [x] Spark

  • Spark3.0新特性
  • Flink
  • [ ] NiFi

    大数据-环境搭建

  • [ ] CDH

  • [ ] HDP

    大数据-云平台

  • [ ] 数仓构建

  • [ ] 千亿数据调优

    �大数据-项目

  • [ ] 疫情防控平台

  • BI商业分析平台
  • 反爬虫
  • 流量运营分析系统
  • 智数电商
  • 千面电商

    Kubernetes