单机本地模式
local[N]
N:cpu核数
spark-submit —class JavaWordCount —master local[10] JavaWordCount.jar file:///tmp/test.txt
local-cluster[2, 3, 1024]
单机模拟集群 x代表要生成的executor数,y和z分别代表每个executor所拥有的core和memory数。
spark-submit —master local-cluster[2, 3, 1024]
Standalone
client
spark-submit —master spark://wl1:7077 —deploy-mode client
cluster
spark-submit —master spark://wl1:6066 —deploy-mode cluster
YARN
Client
spark-submit —master yarn —deploy-mode client
cluster
spark-submit —master yarn —deploy-mode cluster
Client和Cluster的异同
相同点:
driver都占用一个core
application master都运行在某个节点上
不同点:
cluster模式Driver运行在application master上。
client模式 Driver运行在客户端。
流量问题:1、client模式下driver流量激增
2、client模式因为driver不和集群在同一机房,所以通信不好 运行时间长
