数据分析师是做什么的?Kafka 中 group 发挥了什么作用?Kylin 在知名互联网公司的应用 | 合集Hive Json数据序列化Spark SQL - 简介Spark SQL - DataFrame如何优雅的关闭 Spark Streaming 程序(2种思路)分布式系统以及CAP原理大数据学习-分阶段(待更新)CDC是什么?有没有合适的技术方案?淘宝用户行为数据集面试准备马蜂窝数据仓库的架构选择适合你的开源 OLAP 引擎王者荣耀背后的实时大数据平台是什么样的?跟着源码搞起来大数据开发工程师到底是干嘛的?工作日常分享