以下均可按照离线数仓的要求来,之前学过离线数仓的小伙伴,并且保留之前的资源情况下,无需再次创建资源,减少时间

服务器和JDK准备

https://blog.csdn.net/weixin_45417821/article/details/120856089

数仓 模拟数据

https://blog.csdn.net/weixin_45417821/article/details/120857100

常规大数据组件安装

https://blog.csdn.net/weixin_45417821/article/details/120858442

数仓组件Flume安装

https://blog.csdn.net/weixin_45417821/article/details/120866669

注意这里没有flume消费到Kafka的情况了,没有f2.sh的脚本了,只有f1.sh脚本,因为离线中f2.sh脚本是 Flume 收集 Kafka中的数据到HDFS中,而实时中已经没有了,实时计算中,是 Flink 收集Kafka中的数据。