单机本地模式

local[N]

N:cpu核数
spark-submit —class JavaWordCount —master local[10] JavaWordCount.jar file:///tmp/test.txt

local-cluster[2, 3, 1024]

单机模拟集群 x代表要生成的executor数,y和z分别代表每个executor所拥有的core和memory数。
spark-submit —master local-cluster[2, 3, 1024]

Standalone

client

spark-submit —master spark://wl1:7077 —deploy-mode client

cluster

spark-submit —master spark://wl1:6066 —deploy-mode cluster

YARN

Client

spark-submit —master yarn —deploy-mode client

cluster

spark-submit —master yarn —deploy-mode cluster

Client和Cluster的异同

相同点:
driver都占用一个core
application master都运行在某个节点上

不同点:
cluster模式Driver运行在application master上。
client模式 Driver运行在客户端。
流量问题:1、client模式下driver流量激增
2、client模式因为driver不和集群在同一机房,所以通信不好 运行时间长