Apache Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。Flink设计为在所有常见的集群环境中运行,以内存速度和任何规模执行计算
下载
从官方网站下载版本 flink-1.10.1-bin-scala_2.12.tgz,网址为:https://flink.apache.org/downloads.html
下载URL:https://archive.apache.org/dist/flink/flink-1.10.1/flink-1.10.1-bin-scala_2.12.tgz
解压
tar -zxvf flink-1.10.1-bin-scala_2.12.tgzmv flink-1.10.1 flink
修改配置文件
# 1. 进入config目录cd ./flink/conf# 2. 修改flink-conf.yaml,masters,slavesvim server.properties# 添加如下配置env.java.home: /data/java/jdk-11.0.8# 可根据机器环境调整大小env.java.ops: -Xms2048m -Xmx2048m# 默认配置 jobmanager.rpc.address: localhost 改为:jobmanager.rpc.address: clown# 以下两项可根据机器环境调整大小# 默认配置 jobmanager.heap.size: 1024m 改为jobmanager.heap.size: 2048m# 默认配置 jobmanager.heap.size: 1728m 改为jobmanager.heap.size: 2048m# 任务管理插槽,最低设置为8 默认配置 taskmanager.numberOfTaskSlots: 1 改为taskmanager.numberOfTaskSlots: 12# 任务并行度,默认配置 parallelism.default: 1 改为parallelism.default: 4# zookeeper.connect修改为本机或集群zookeeper的连接地址zookeeper.connect=clown:2181# 如果是集群zookeeper.connect=clown01:2181,clown02:2181,clown03:2181# 3. 修改masters# 默认配置 localhost:8081 改为clown:8081# 4. 修改slaves# 默认配置 localhost 改为clown
配置环境变量
vim /etc/profile# 添加export FLINK_HOME=/data/flink #(这里flink安装目录)export PATH=${PATH}:${FLINK_HOME}/bin
启动
# 1. 进入bin目录,并启动flink,如果不是在bin目录下执行,需写绝对路径,# bin目录,注意: ./start-cluster.sh前面的 . 不可忽略。./start-cluster.sh# 绝对路径,本机flink目录/data/flink/data/flink/bin/start-cluster.sh
查看是否启动
# 1. 使用jps,可查看当前运行的程序# 如果包含以下两个程序,则代表启动成功StandaloneSessionClusterEntrypointTaskManagerRunner# 2. 使用WEB UI界面# 使用IP:PORT,如果进入页面,则代表启动成功
