一、实现 Service伸缩

swarm 要实现运行多个实例。这样可以负载均衡,同时也能提供高可用,增加 service 的副本数就可以了。在swarm-manager 上执行如下命令:
docker service scale web_server=5
image.png
副本数增加到 5,通过 docker service ls 和 docker service ps 查看副本的详细信息。
image.png
5 个副本已经分布在 swarm 的所有三个节点上。
默认配置下 manager node 也是 worker node,所以 swarm-manager 上也运行了副本。如果不希望在 manager 上运行 service,可以执行如下命令:
docker node update --availability drain host2
image.png
通过 docker node ls 查看各节点现在的状态:
image.png
Drain 表示swarm-manager 已经不负责运行 service,之前 swarm-manager 运行的那个副本会如何处理呢?用 docker service ps 查看一下:
image.png
host2 上的副本 web_server.4 已经被 Shutdown 了,为了达到 5 个副本数的目标,在 vm1 上添加了副本 web_server.4。(web_server.5同理)
前面我们的场景是 scale up,我们还可以 scale down,减少副本数,运行下面的命令:
docker service scale web_server=3
image.png
可以看到,web_server.4 和 web_server.5 这两个副本已经被删除了。
image.png
Service 的伸缩就讨论到这里,下边学习故障切换 Failover。

二、Swarm 实现 Failover

故障是在所难免的,容器可能崩溃,Docker Host 可能宕机,不过幸运的是,Swarm 已经内置了 failover 策略。
创建 service 的时候,我们没有告诉 swarm 发生故障时该如何处理,只是说明了我们期望的状态(比如运行3个副本),swarm 会尽最大的努力达成这个期望状态,无论发生什么状况。
上一节我们部署的 Service 为例,当前 3 个副本分布在 vm1和 vm2 上。
现在我们测试 swarm 的 failover 特性,关闭 vm1。
image.png
Swarm 会检测到 vm1 的故障,并标记为 Down。
image.png
Swarm 会将 vm1 上的副本调度到其他可用节点。我们可以通过 docker service ps 观察这个 failover 过程。
image.png
可以看到,web_server.1 和 web_server.2 已经从 vm1 迁移到了 vm2,之前运行在故障节点 vm1 上的副本状态被标记为 Shutdown。