现在我们知道如何安装Docker、拉取镜像以及使用容器,接下来我们需要一种在规模上进行所有操作的方式。这就是Docker Swarm发挥作用的地方。
和往常一样,我们将把本章分成三个部分:
- 概述(TLDR)
- 深入探讨(Deep Dive)
- 命令(Commands)
Docker Swarm - 简要概述
Docker Swarm是两个方面的东西:
- 企业级安全的Docker主机集群
- 微服务应用的编排器
在集群方面,Swarm将一个或多个Docker节点组成集群,并允许您将它们管理为一个整体。开箱即用,您将获得一个加密的分布式集群存储、加密网络、双向TLS、安全的集群加入令牌以及一个简化证书管理和轮换的PKI系统。您甚至可以非破坏性地添加和移除节点。这真是一项令人惊叹的功能。
在编排方面,Swarm允许您轻松部署和管理复杂的微服务应用程序。您可以使用声明性文件定义您的应用程序,并使用本机Docker命令将它们部署到Swarm中。您甚至可以执行滚动更新、回滚和扩展操作。同样,所有这些都可以通过简单的命令完成。
Docker Swarm与Kubernetes类似,它们都用于编排容器化应用程序。Kubernetes具有更多的动力和更活跃的社区和生态系统。然而,Swarm更容易使用,因此对于许多中小型企业和应用程序部署而言是一个受欢迎的选择。学习Swarm是学习Kubernetes的一个跳板。
Docker Swarm - 深入探讨
我们将按以下方式分割本章深入探讨的部分:
- Swarm入门
- 构建一个安全的Swarm集群
- 部署Swarm服务
- 故障排除
- 备份和恢复Swarm
Swarm入门
在集群方面,一个Swarm由一个或多个Docker节点组成。这些节点可以是物理服务器、虚拟机、树莓派或云实例。唯一的要求是它们都已安装Docker,并且可以通过可靠的网络进行通信。
术语:当提到Docker Swarm时,我们会使用大写的"S"写作Swarm。当提到一个swarm(节点集群)时,我们将使用小写的"s"。
节点被配置为管理节点或工作节点。管理节点负责控制平面,即集群状态和将任务分派给工作节点等。工作节点接受来自管理节点的任务并执行它们。
Swarm的配置和状态存储在分布式数据库中,该数据库在所有管理节点上进行复制。它保持在内存中,非常及时更新。然而,最棒的是它不需要任何配置------它作为Swarm的一部分安装,并自动管理自己。
TLS(传输层安全性)被紧密集成,没有它是不可能构建一个Swarm的。在今天注重安全的世界中,这样的事情值得赞扬。Swarm使用TLS来加密通信、验证节点并授权角色。还提供了自动密钥轮换,这是锦上添花。最棒的部分是...它都运行得如此顺畅,以至于你几乎感觉不到它的存在。
在编排方面,Swarm上调度的原子单位是服务(service)。这是一个高级构造,围绕容器包装了一些高级功能。这些功能包括扩展、滚动更新和简单的回滚。可以将服务视为增强型容器,这样有助于理解。
Swarm的高层次视图如图10.1所示。
这就够了关于基础知识的介绍了。让我们动手实践一些例子。
构建一个安全的Swarm集群
在这一部分,我们将构建一个安全的Swarm集群,包括三个管理节点和三个工作节点,如图10.2所示。
先决条件
如果您计划跟随操作,我建议使用Multipass在您的笔记本电脑或本地机器上创建多个Docker虚拟机。Multipass是免费且易于使用的,所有虚拟机都能够相互通信。只需安装Multipass,然后使用以下命令创建虚拟机并登录到它们:
- 创建新的Docker虚拟机:multipass launch docker --name
- 列出Multipass虚拟机及其IP地址:multipass ls
- 登录到Multipass虚拟机:multipass shell
- 从Multipass虚拟机注销:exit
我已经创建了6个虚拟机,并根据图10.2中的命名。
如果无法使用Multipass,我建议在labs.play-with-docker.com 上创建多个节点。这是免费使用的,您可以获得4小时的练习时间。
但是,任何Docker环境都应该可以工作。唯一的要求是每个节点都已安装了Docker,并且可以在可靠的网络上进行通信。如果配置了名称解析,那将非常有益------它可以使在命令输出中更容易识别节点,并在故障排除时有所帮助。
如果您计划在Docker Desktop上跟随操作,请注意它只支持单个Docker节点。这没问题,但对于后面的一些示例来说不是最佳选择。
如果您遇到网络问题,请确保所有Swarm节点之间开放了以下端口:
- 2377/tcp:用于安全的客户端到Swarm的通信
- 7946/tcp和udp:用于控制平面消息传递
- 4789/udp:用于基于VXLAN的覆盖网络
初始化一个新的Swarm
构建Swarm的过程称为初始化Swarm,其高级流程如下:初始化第一个管理节点 > 加入其他管理节点 > 加入工作节点 > 完成。
不属于Swarm的Docker节点被称为处于单引擎模式。一旦它们被添加到Swarm中,它们会自动切换到Swarm模式。
在单引擎模式下运行docker swarm init
命令的Docker主机将会切换为Swarm模式,创建一个新的Swarm,并将该节点设为Swarm的第一个管理节点。
然后可以将其他节点加入为工作节点或管理节点,加入过程会自动将它们切换为Swarm模式。
以下步骤将从mgr1初始化一个新的Swarm。然后,它将加入wrk1、wrk2和wrk3作为工作节点------在此过程中会自动将它们切换为Swarm模式。最后,它将添加mgr2和mgr3作为额外的管理节点,并切换它们到Swarm模式。在此过程结束后,所有6个节点都将处于Swarm模式,并作为同一Swarm的一部分运行。
此示例将使用图10.2中显示的节点的名称和IP地址。您的节点名称和IP地址可能会有所不同。
- 登录到mgr1,并初始化一个新的Swarm。此命令使用图10.2中的IP地址。您应该在您的Docker主机上使用适当的私有IP地址。如果您使用Multipass,通常会使用VM的192地址。
sql
$ docker swarm init \
--advertise-addr 10.0.0.1:2377 \
--listen-addr 10.0.0.1:2377
Swarm initialized: current node (d21lyz...c79qzkx) is now a manager.
<Snip>
该命令可以分解为以下部分:
docker swarm init
:告诉Docker初始化一个新的Swarm,并将此节点设置为第一个管理节点。它还将节点切换到Swarm模式。--advertise-addr
:这是将被广告给其他管理节点和工作节点的Swarm API终点。通常,它将是节点的IP地址之一,但也可以是外部负载均衡器地址。这是一个可选标志,除非您需要在具有多个IP的节点上指定负载均衡器或特定IP。--listen-addr
:这是节点将接受Swarm流量的IP地址。如果不设置它,它将默认为与--advertise-addr
相同的值。如果--advertise-addr
是一个负载均衡器,您必须使用--listen-addr
来指定Swarm流量的本地IP或接口。
在生产环境中,我建议您明确指定并始终使用这两个标志。在像我们的实验环境这样的实验室环境中,这并不那么重要。
Swarm模式的默认端口是2377。这是可以自定义的,但通常约定使用2377/tcp来进行安全(HTTPS)的客户端到Swarm的连接。
- 列出Swarm中的节点。
shell
$ docker node ls
ID HOSTNAME STATUS AVAILABILITY MANAGER STATUS
d21...qzkx * mgr1 Ready Active Leader
目前,mgr1是Swarm中唯一的节点,并被列为领导节点。我们稍后会再次回到这一点。
- 从mgr1运行
docker swarm join-token
命令,以提取添加新的工作节点和管理节点到Swarm所需的命令和令牌。
csharp
$ docker swarm join-token worker
To add a manager to this swarm, run the following command:
docker swarm join \
--token SWMTKN-1-0uahebax...c87tu8dx2c \
10.0.0.1:2377
$ docker swarm join-token manager
To add a manager to this swarm, run the following command:
docker swarm join \
--token SWMTKN-1-0uahebax...ue4hv6ps3p \
10.0.0.1:2377
请注意,加入工作节点和管理节点的命令除了加入令牌(SWMTKN...)之外完全相同。这意味着一个节点是加入为工作节点还是管理节点完全取决于您在加入时使用的令牌。您应该将加入令牌妥善保存,因为它们是加入节点到Swarm所需的唯一要素!
- 登录到wrk1,并使用带有工作节点加入令牌的
docker swarm join
命令将其加入Swarm。
sql
$ docker swarm join \
--token SWMTKN-1-0uahebax...c87tu8dx2c \
10.0.0.1:2377 \
--advertise-addr 10.0.0.4:2377 \
--listen-addr 10.0.0.4:2377
This node joined a swarm as a worker.
--advertise-addr
和 --listen-addr
标志是可选的。我已经添加它们,因为在生产环境中,对网络配置的具体性是最佳实践。在实验室环境中,您可能不需要它们。
-
重复前面的步骤,在wrk2和wrk3上执行相同的操作,以它们加入Swarm作为工作节点。如果您正在指定
--advertise-addr
和--listen-addr
标志,请确保使用wrk2和wrk3的相应IP地址。 -
然后登录到mgr2,并使用管理节点加入令牌的
docker swarm join
命令将其加入Swarm作为管理节点。
sql
$ docker swarm join \
--token SWMTKN-1-0uahebax...ue4hv6ps3p \
10.0.0.1:2377 \
--advertise-addr 10.0.0.2:2377 \
--listen-addr 10.0.0.2:2377
This node joined a swarm as a manager.
-
重复上一步骤在mgr3上执行,记得使用mgr3的IP地址作为
advertise-addr
和--listen-addr
标志的值。 -
然后从任何一个管理节点上运行
docker node ls
命令来列出Swarm中的节点。
shell
$ docker node ls
ID HOSTNAME STATUS AVAILABILITY MANAGER STATUS
0g4rl...babl8 * mgr2 Ready Active Reachable
2xlti...l0nyp mgr3 Ready Active Reachable
8yv0b...wmr67 wrk1 Ready Active
9mzwf...e4m4n wrk3 Ready Active
d21ly...9qzkx mgr1 Ready Active Leader
e62gf...l5wt6 wrk2 Ready Active
恭喜!您已经成功创建了一个包含3个管理节点和3个工作节点的6节点Swarm。在这个过程中,每个节点上的Docker引擎已经自动切换到Swarm模式,并使用TLS自动保护了Swarm。
如果您查看"MANAGER STATUS"列,您将看到三个管理节点显示为"Reachable"或"Leader"。我们很快将更多地了解关于领导节点的信息。在"MANAGER STATUS"列中没有任何内容的节点是工作节点。还请注意在显示mgr2的行的ID后面有一个星号(*)。这告诉您正在从哪个节点执行命令。前一个命令是从mgr2发出的。
注意:在每次将节点加入Swarm时都手动指定--advertise-addr
和 --listen-addr
标志可能有些繁琐。然而,如果您配置Swarm的网络错误,可能会导致更大的麻烦。此外,手动将节点添加到Swarm不太可能是日常任务,因此值得在开始时额外付出努力来使用这些标志。当然,这是您的选择。在实验环境或仅具有单个IP的节点上,您可能不需要使用它们。
现在您已经创建了一个正在运行的Swarm,让我们来看看管理节点的高可用性(HA)。
Swarm管理节点的高可用性(HA)
到目前为止,我们已经将三个管理节点添加到Swarm中。为什么是三个?它们是如何共同工作的?
Swarm管理节点具有本地支持高可用性(HA)的能力。这意味着一个或多个管理节点可以出现故障,而幸存的管理节点将继续运行Swarm。
从技术上讲,Swarm实现了主动/被动的多管理节点高可用性。这意味着在任何给定时刻只有一个管理节点是活动的。这个活动的管理节点被称为"领导者",领导者是唯一一个会对Swarm发出更新的节点。因此,只有领导者会更改配置或向工作节点发出任务。如果一个跟随者管理节点(被动)接收到Swarm的命令,它会将这些命令代理到领导者。
这个过程如图10.3所示。第1步是命令从远程Docker客户端传入管理节点。第2步是非领导者管理节点接收命令并将其代理给领导者。第3步是领导者在Swarm上执行命令。
"Leaders" 和 "Followers" 是Raft算法的术语。这是因为Swarm使用Raft共识算法的一种实现来维护在多个高可用管理节点之间保持一致的集群状态。
在关于高可用性的主题上,以下两个最佳实践适用:
- 部署奇数个管理节点。
- 不要部署太多管理节点(建议使用3或5个)。
- 将管理节点分布在可用性区域之间。
部署奇数个管理节点减少了分裂脑(Split Brain)条件发生的机会。例如,如果我们有4个管理节点并且网络分区了,我们可能会在分区的两侧各留下两个管理节点。这被称为分裂脑 ------ 每一侧都知道以前有4个管理节点,但现在只能看到2个。但至关重要的是,两侧都无法知道另外两个管理节点是否仍然存活,以及它们是否占据多数(法定多数)。Swarm集群上的应用程序在分裂脑条件下继续运行,但我们无法更改配置或添加和管理应用程序工作负载。
然而,如果我们有3或5个管理节点,并且发生了相同的网络分区,那么在分区的两侧不可能有相等数量的管理节点。这意味着一侧知道它拥有多数(法定多数),并且完整的集群管理服务仍然可用。图10.4右侧的示例显示了一个分区的集群,其中分裂的一侧知道它拥有大多数的管理节点。
与所有共识算法一样,参与者越多,达成共识所需的时间就越长。这就像决定在哪里吃饭 ------ 对于3个人来说,总是比33个人更容易和更快地做出决定!因此,基于这一考虑,最佳做法是在高可用性方案中使用3个或5个管理节点。7个管理节点可能会起作用,但一般认为3个或5个是最佳选择。
关于管理节点的高可用性,最后需要警告的是,虽然将管理节点分布在可用性区域之间是一种良好的做法,但您需要确保连接它们的网络是可靠的,因为网络分区可能会很难排除故障和解决问题。这意味着,在编写时,将管理节点部署在不同的云平台上以实现多云高可用性可能不是一个好主意。
内建的Swarm安全性
Swarm集群具有大量内置的安全性,它们在开箱即用时配置了合理的默认值,包括CA设置、加入令牌、双向TLS、加密集群存储、加密网络、加密节点ID等。
锁定Swarm
尽管具有所有这些内置安全性,但重新启动旧的管理节点或恢复旧的备份可能会威胁到集群的安全性。重新加入的旧管理节点可能能够解密并访问Raft日志时间序列数据库。它们还可能会污染或抹消当前的Swarm配置。
为了防止出现这样的情况,Docker允许您使用Autolock功能来锁定Swarm。这将强制重新启动的管理节点在被允许重新加入集群之前提供一个密钥。
在初始化过程中,可以通过在docker swarm init
命令中传递--autolock
标志来锁定Swarm。但是,我们已经构建了一个Swarm,所以我们将使用docker swarm update
命令来锁定Swarm。
从Swarm管理节点运行以下命令。
vbnet
$ docker swarm update --autolock=true
Swarm updated.
To unlock a swarm manager after it restarts, run the `docker swarm unlock` command and
provide the following key:
SWMKEY-1-XDeU3XC75Ku7rvGXixJ0V7evhDJGvIAvq0D8VuEAEaw
Please remember to store this key in a password manager, since without it you will not be able
to restart the manager.
请确保将解锁密钥保存在安全的地方。您随时可以使用docker swarm unlock-key
命令来检查当前的Swarm解锁密钥。
重新启动其中一个管理节点,看看它是否会自动重新加入集群。您可能需要在命令前加上sudo
前缀。
ruby
$ service docker restart
尝试列出Swarm中的节点。
vbnet
$ docker node ls
Error response from daemon: Swarm is encrypted and needs to be unlocked before it can be used.
尽管管理节点上的Docker服务已重新启动,但它还没有被允许重新加入Swarm。您可以通过在另一个管理节点上运行docker node ls
命令来进一步证明这一点。重新启动的管理节点将显示为下线和无法访问。
运行docker swarm unlock
命令以解锁重新启动的管理节点的Swarm。您需要在重新启动的管理节点上运行此命令,并提供解锁密钥。
vbnet
$ docker swarm unlock
Please enter unlock key: <enter your key>
重新启动的节点将被允许重新加入Swarm,如果您运行另一个docker node ls
命令,它将显示为"ready"和"reachable"。
在生产环境中,建议锁定您的Swarm并保护解锁密钥。
专用管理节点
默认情况下,管理节点和工作节点都可以执行用户应用程序。在生产环境中,通常会配置Swarm,以便只有工作节点才能执行用户应用程序。这使得管理节点可以专注于控制平面的任务。
从任何一个管理节点运行以下三个命令,以防止所有三个管理节点运行应用程序容器。
sql
$ docker node update --availability drain mgr1
$ docker node update --availability drain mgr2
$ docker node update --availability drain mgr3
当我们部署具有多个副本的服务时,您将在后续步骤中看到这一点。
现在我们已经构建了Swarm,并了解了领导者和管理节点HA的基础概念,让我们继续进行应用程序方面的工作。
部署Swarm服务
在本章的这一部分,我们所做的一切都将在后面的章节中由Docker Stacks进行改进。然而,重要的是您要在这里学习这些概念,以便为以后做好准备。
服务允许我们指定大多数熟悉的容器选项,如名称、端口映射、连接到网络和镜像。但它们还添加了重要的云原生特性,包括期望状态和协调。例如,Swarm服务允许我们定义应用程序的期望状态,让Swarm负责部署和管理它。
让我们看一个快速的示例。假设您有一个带有Web前端的应用程序。您有一个Web服务器的镜像,测试已经表明您需要5个实例来处理正常的日常流量。您可以将此要求转化为一个单一的服务,声明要使用的镜像,并且该服务应始终具有5个运行的副本。您将这个期望状态传递给Swarm,Swarm会负责确保始终有5个Web服务器实例在运行。
我们将在接下来的几分钟内看到可以在服务的一部分中声明的其他内容,但在我们这样做之前,让我们看一看创建我们刚刚描述的内容的一种方法。
您可以通过以下两种方式之一创建服务:
- 使用
docker service create
命令在命令行上以命令方式创建。 - 使用堆栈文件以声明方式创建。
我们将在后面的章节中介绍堆栈文件。现在,我们将专注于命令方式创建服务。
sql
$ docker service create --name web-fe \
-p 8080:8080 \
--replicas 5 \
nigelpoulton/ddd-book:web0.1
z7ovearqmruwk0u2vc5o7ql0p
overall progress: 5 out of 5 tasks
1/5: running [==================================================>]
2/5: running [==================================================>]
3/5: running [==================================================>]
4/5: running [==================================================>]
5/5: running [==================================================>]
verify: Service converged
让我们回顾一下这个命令和输出。
docker service create
命令告诉Docker部署一个新的服务。我们使用--name
标志为其命名为web-fe
。我们告诉Docker将每个Swarm节点的端口8080映射到每个服务副本(容器)内部的8080端口。接下来,我们使用--replicas
标志告诉Docker,该服务应始终有5个副本。最后,我们告诉Docker应该基于哪个镜像创建这些副本 ------ 需要理解的重要一点是,所有服务副本都使用相同的镜像和配置!
术语说明:服务部署容器,我们通常将这些容器称为副本。例如,部署三个副本的服务将部署三个相同的容器。
该命令被发送到一个管理节点,领导管理节点在整个Swarm中实例化了5个副本。此Swarm中的管理节点不允许运行应用程序容器,这意味着所有5个副本都部署到工作节点上。每个接收到工作任务的工作节点都会拉取镜像并启动一个监听8080端口的副本。Swarm领导者还确保了期望状态的副本存储在集群上,并被复制到每个管理节点。
但这并不是结束。所有服务都会被Swarm不断监视 ------ Swarm会运行一个后台协调循环,不断比较服务的观察状态与期望状态。如果两个状态匹配,那么一切都正常,不需要进一步的操作。如果它们不匹配,Swarm将采取措施将观察状态与期望状态保持一致。
举个例子,如果托管5个副本之一的工作节点失败,那么服务的观察状态将从5个副本降到4个,不再与期望状态5个相匹配。因此,Swarm将启动一个新的副本,以使观察状态恢复与期望状态保持一致。我们称之为协调或自愈,这是云原生应用程序的关键原则之一。
查看和检查服务
您可以使用docker service ls
命令来查看在Swarm上运行的所有服务的列表。
bash
$ docker service ls
ID NAME MODE REPLICAS IMAGE PORTS
z7o...uw web-fe replicated 5/5 nigelpoulton/ddd... *:8080->8080/tcp
输出显示了一个单一的服务以及一些基本的配置和状态信息。除其他事项外,我们可以看到服务的名称以及5个期望的副本中有5个正在运行。如果您在部署服务后不久运行此命令,它可能不会显示所有副本正在运行。这通常是因为工作节点正在拉取镜像。
您可以使用docker service ps
命令来查看服务副本的列表以及每个副本的状态。
sql
$ docker service ps web-fe
ID NAME IMAGE NODE DESIRED CURRENT
817...f6z web-fe.1 nigelpoulton/... wrk1 Running Running 2 mins
a1d...mzn web-fe.2 nigelpoulton/... wrk1 Running Running 2 mins
cc0...ar0 web-fe.3 nigelpoulton/... wrk2 Running Running 2 mins
6f0...azu web-fe.4 nigelpoulton/... wrk3 Running Running 2 mins
dyl...p3e web-fe.5 nigelpoulton/... wrk3 Running Running 2 mins
该命令的格式是docker service ps <服务名称或服务ID>
。输出将每个副本显示在自己的行上,显示其正在运行的节点,并显示期望状态和当前观察到的状态。
要获取有关服务的详细信息,请使用docker service inspect
命令。
yaml
$ docker service inspect --pretty web-fe
ID: z7ovearqmruwk0u2vc5o7ql0p
Name: web-fe
Service Mode: Replicated
Replicas: 5
Placement:
UpdateConfig:
Parallelism: 1
On failure: pause
Monitoring Period: 5s
Max failure ratio: 0
Update order: stop-first
RollbackConfig:
Parallelism: 1
On failure: pause
Monitoring Period: 5s
Max failure ratio: 0
Rollback order: stop-first
ContainerSpec:
Image: nigelpoulton/ddd-book:web0.1@sha256:8d6280c0042...1b9e4336730e5
Init: false
Resources:
Endpoint Mode: vip
Ports:
PublishedPort = 8080
Protocol = tcp
TargetPort = 8080
PublishMode = ingress
该示例使用--pretty
标志来将输出限制为以易于阅读的格式打印的最有趣的项目。如果不使用--pretty
标志,将获得更多信息。我强烈建议您阅读docker inspect
命令的输出,因为它们是获取信息和了解底层情况的绝佳来源。
稍后我们会回到其中的一些输出。
复制服务与全局服务
服务的默认复制模式是replicated
。这会部署所需数量的副本,并尽可能均匀地分布在整个集群中。
另一种模式是global
。这在Swarm中的每个节点上运行一个副本。
要部署全局服务,您需要在docker service create
命令中传递--mode global
标志。全局服务不接受--replicas
标志,因为它们总是在每个可用节点上运行一个副本。但是,它们确实尊重节点的可用性。例如,如果您已经使管理节点停止运行应用程序容器,全局服务将不会在它们上安排副本。
扩展服务
服务的另一个强大功能是轻松地将它们进行扩展和缩减。
假设业务蓬勃发展,我们看到前端Web收到的流量增加了一倍。幸运的是,我们可以使用docker service scale
命令轻松地扩展该服务。
ini
$ docker service scale web-fe=10
web-fe scaled to 10
overall progress: 10 out of 10 tasks
1/10: running [==================================================>]
2/10: running [==================================================>]
3/10: running [==================================================>]
4/10: running [==================================================>]
5/10: running [==================================================>]
6/10: running [==================================================>]
7/10: running [==================================================>]
8/10: running [==================================================>]
9/10: running [==================================================>]
10/10: running [==================================================>]
此命令将服务副本的数量从5个增加到10个。在后台,它将服务的期望状态从5个更新为10个。运行另一个docker service ls
以验证操作是否成功。
bash
$ docker service ls
ID NAME MODE REPLICAS IMAGE PORTS
z7o...uw web-fe replicated 10/10 nigelpoulton/ddd... *:8080->8080/tcp
运行docker service ps
命令将显示服务副本均匀分布在所有可用节点上。
bash
$ docker service ps web-fe
ID NAME IMAGE NODE DESIRED CURRENT
nwf...tpn web-fe.1 nigelpoulton/... wrk1 Running Running 7 mins
yb0...e3e web-fe.2 nigelpoulton/... wrk3 Running Running 7 mins
mos...gf6 web-fe.3 nigelpoulton/... wrk2 Running Running 7 mins
utn...6ak web-fe.4 nigelpoulton/... wrk3 Running Running 7 mins
2ge...fyy web-fe.5 nigelpoulton/... wrk2 Running Running 7 mins
64y...m49 web-fe.6 igelpoulton/... wrk3 Running Running about a min
ild...51s web-fe.7 nigelpoulton/... wrk1 Running Running about a min
vah...rjf web-fe.8 nigelpoulton/... wrk1 Running Running about a min
xe7...fvu web-fe.9 nigelpoulton/... wrk2 Running Running 45 seconds ago
l7k...jkv web-fe.10 nigelpoulton/... wrk1 Running Running 46 seconds ago
在幕后,Swarm运行一个称为spread的调度算法,试图尽可能均匀地分配副本到可用节点上。在撰写本文时,这意味着在每个节点上运行相同数量的副本,而不考虑CPU负载等因素。
运行另一个docker service scale
命令,将副本数量从10减少到5。
ini
$ docker service scale web-fe=5
web-fe scaled to 5
overall progress: 5 out of 5 tasks
1/5: running [==================================================>]
2/5: running [==================================================>]
3/5: running [==================================================>]
4/5: running [==================================================>]
5/5: running [==================================================>]
verify: Service converged
现在您知道如何扩展服务了,让我们看看如何删除它们。
移除服务
删除服务很简单 - 也许过于简单了。
运行以下docker service rm
命令来删除web-fe
服务。
shell
$ docker service rm web-fe
web-fe
使用docker service ls
命令确认它已经不存在了。
shell
$ docker service ls
ID NAME MODE REPLICAS IMAGE PORTS
小心使用这个命令,因为它会删除所有服务副本,而不会要求确认。
让我们看看如何进行滚动更新。
滚动更新
将更新推送到应用程序是现实生活中的一部分,很长一段时间以来,这是一个痛苦的过程。我个人已经花了足够多的周末来进行重大应用程序更新,我不打算再这样做了。
嗯...多亏了Docker服务,对于设计良好的微服务应用程序来说,推送更新变得很容易。
术语说明:我们使用诸如rollouts、updates和rolling updates等术语来表示相同的事情 - 更新正在运行的应用程序。
为了查看一个rollout,我们将部署一个新的服务。但在此之前,我们将为该服务创建一个新的overlay网络。这并不是必需的,但我希望您看到它是如何完成的以及如何将服务连接到它。
sql
$ docker network create -d overlay uber-net
43wfp6pzea470et4d57udn9ws
运行docker network ls
来验证网络是否正确创建并在Docker主机上可见。
shell
$ docker network ls
NETWORK ID NAME DRIVER SCOPE
43wfp6pzea47 uber-net overlay swarm
<Snip>
uber-net网络已成功创建,具有swarm范围,目前只在swarm的管理节点上可见。当工作负载使用它运行时,它将动态扩展到工作节点。
Overlay网络是一个可以跨越所有swarm节点的第二层网络。在相同overlay网络上的所有容器都可以通信,即使它们部署在不同的节点上也是如此。即使所有swarm节点位于不同的底层网络上,也可以正常工作。
图10.5显示了连接到两个不同的底层网络的四个swarm节点,这两个底层网络由一个三层路由器连接。Overlay网络跨越所有4个节点,并创建一个单一的扁平第二层网络,抽象了所有底层网络。
让我们创建一个新的服务,并将其连接到uber-net
网络。
sql
$ docker service create --name uber-svc \
--network uber-net \
-p 8080:8080 --replicas 12 \
nigelpoulton/ddd-book:web0.1
dhbtgvqrg2q4sg07ttfuhg8nz
overall progress: 12 out of 12 tasks
1/12: running [==================================================>]
2/12: running [==================================================>]
3/12: running [==================================================>]
<Snip>
12/12: running [==================================================>]
verify: Service converged
让我们看看我们部署了什么。
首先,我们命名了这个服务为uber-svc
。然后,我们使用--network
标志告诉它将所有副本连接到uber-net
网络。然后,我们将端口8080暴露到整个swarm并将其映射到我们要求运行的每个12个副本的内部端口8080。最后,我们告诉它将所有副本基于nigelpoulton/ddd-book:web0.1
镜像。
在swarm的每个节点上发布端口的这种模式,甚至不运行服务副本的节点,称为入口模式,是默认模式。另一种模式是主机模式,它仅将服务发布到运行副本的swarm节点。
运行docker service ls
和docker service ps
来验证新服务的状态。
bash
$ docker service ls
ID NAME REPLICAS IMAGE
dhbtgvqrg2q4 uber-svc 12/12 nigelpoulton/ddd-book:web0.1
$ docker service ps uber-svc
ID NAME IMAGE NODE DESIRED CURRENT STATE
0v...7e5 uber-svc.1 nigelpoulton/ddd... wrk3 Running Running 1 min
bh...wa0 uber-svc.2 nigelpoulton/ddd... wrk2 Running Running 1 min
23...u97 uber-svc.3 nigelpoulton/ddd... wrk2 Running Running 1 min
82...5y1 uber-svc.4 nigelpoulton/ddd... wrk2 Running Running 1 min
c3...gny uber-svc.5 nigelpoulton/ddd... wrk3 Running Running 1 min
e6...3u0 uber-svc.6 nigelpoulton/ddd... wrk1 Running Running 1 min
78...r7z uber-svc.7 nigelpoulton/ddd... wrk1 Running Running 1 min
2m...kdz uber-svc.8 nigelpoulton/ddd... wrk3 Running Running 1 min
b9...k7w uber-svc.9 nigelpoulton/ddd... wrk3 Running Running 1 min
ag...v16 uber-svc.10 nigelpoulton/ddd... wrk2 Running Running 1 min
e6...dfk uber-svc.11 nigelpoulton/ddd... wrk1 Running Running 1 min
e2...k1j uber-svc.12 nigelpoulton/ddd... wrk1 Running Running 1 min
打开一个Web浏览器,将其指向任何swarm节点的IP地址,端口设置为8080,以查看运行中的服务。
随时可以将您的Web浏览器指向swarm中的其他节点。您可以从任何节点访问Web服务,因为该服务已在整个swarm中发布。
现在让我们假设有另一本书需要添加到网站上。还假设已经为其创建了一个新的镜像,并将其添加到相同的Docker Hub存储库中,但此镜像标记为web0.2而不是web0.1。
还假设您的任务是以分阶段的方式将更新后的镜像推送到swarm中,每次2个副本,之间延迟20秒。您可以使用以下docker service update
命令来完成此操作。
yaml
$ docker service update \
--image nigelpoulton/ddd-book:web0.2 \
--update-parallelism 2 \
--update-delay 20s \
uber-svc
uber-svc
overall progress: 2 out of 12 tasks
1/12: running [==================================================>]
2/12: running [==================================================>]
3/12: ready [======================================> ]
4/12: ready [======================================> ]
5/12:
6/12:
<Snip>
11/12:
12/12:
让我们回顾一下该命令。docker service update
允许我们通过更新服务的期望状态来对运行中的服务进行更新。此示例指定了镜像的新版本(web0.2而不是web0.1)。它还指定了 --update-parallelism
和 --update-delay
标志,以确保每次推送2个副本,之间有20秒的冷却时间。最后,它指示swarm对 uber-svc 服务进行更改。
如果在更新正在进行时运行 docker service ps uber-svc
,一些副本将使用新版本,而另一些副本将使用旧版本。如果给予操作足够的时间来完成,所有副本最终将达到使用 web0.2 镜像的新期望状态。
sql
$ docker service ps uber-svc
ID NAME IMAGE NODE DESIRED CURRENT STATE
7z...nys uber-svc.1 nigel...web0.2 mgr2 Running Running 13 secs
0v...7e5 \_uber-svc.1 nigel...web0.1 wrk3 Shutdown Shutdown 13 secs
bh...wa0 uber-svc.2 nigel...web0.1 wrk2 Running Running 1 min
e3...gr2 uber-svc.3 nigel...web0.2 wrk2 Running Running 13 secs
23...u97 \_uber-svc.3 nigel...web0.1 wrk2 Shutdown Shutdown 13 secs
82...5y1 uber-svc.4 nigel...web0.1 wrk2 Running Running 1 min
c3...gny uber-svc.5 nigel...web0.1 wrk3 Running Running 1 min
e6...3u0 uber-svc.6 nigel...web0.1 wrk1 Running Running 1 min
78...r7z uber-svc.7 nigel...web0.1 wrk1 Running Running 1 min
2m...kdz uber-svc.8 nigel...web0.1 wrk3 Running Running 1 min
b9...k7w uber-svc.9 nigel...web0.1 wrk3 Running Running 1 min
ag...v16 uber-svc.10 nigel...web0.1 wrk2 Running Running 1 min
e6...dfk uber-svc.11 nigel...web0.1 wrk1 Running Running 1 min
e2...k1j uber-svc.12 nigel...web0.1 wrk1 Running Running 1 min
您可以通过在任何Swarm节点上打开Web浏览器,然后多次刷新来实时观察更新。一些请求将由运行旧版本的副本处理,而一些请求将由运行新版本的副本处理。经过足够的时间后,所有请求将由运行更新版本的副本处理。
恭喜您!您刚刚完成了一个零停机时间的滚动更新到一个运行中的容器化应用程序。
如果对该服务运行 docker service inspect --pretty
命令,您将看到更新并行性和更新延迟设置已合并到服务的定义中。这意味着将来的更新将自动使用这些设置,除非您在 docker service update
命令中覆盖它们。
yaml
$ docker service inspect --pretty uber-svc
ID: mub0dgtc8szm80ez5bs8wlt19
Name: uber-svc
Service Mode: Replicated
Replicas: 12
<Snip>
UpdateConfig:
Parallelism: 2 <<--------
Delay: 20s <<--------
<Snip>
ContainerSpec:
Image: nigelpoulton/ddd-book:web0.2@sha256:8fc6161f981b...4c2d16062678d
Resources:
Networks: uber-net
Ports:
PublishedPort = 8080
Protocol = tcp
TargetPort = 8080
PublishMode = ingress
您还应该注意一些关于服务的网络配置的事项。在运行服务副本的Swarm中的所有节点都将具有我们之前创建的uber-net覆盖网络。我们可以通过在运行副本的任何节点上运行 docker network ls
来验证这一点。
您还应该注意 docker service inspect
输出的"Networks"部分。这显示了uber-net网络以及整个Swarm范围的(PublishMode: ingress)端口映射。
故障排除
Swarm服务日志可以使用docker service logs
命令查看,但并非所有日志驱动都支持该命令。
默认情况下,Docker节点配置服务使用json-file
日志驱动程序,但还存在其他驱动程序,包括:
awslogs
gelf
gcplogs
journald
(仅适用于运行systemd的Linux主机)splunk
syslog
json-file
和journald
是最容易配置的,两者都与docker service logs
命令一起使用。命令的格式是docker service logs <service-name>
。
如果使用第三方日志驱动程序,应使用该日志平台的原生工具查看这些日志。
以下来自daemon.json
配置文件的代码段显示了一个Docker主机配置为使用syslog。daemon.json
的默认位置是/etc/docker/daemon.json
,但该文件可能不存在,除非您手动创建它以配置自定义设置。
json
{
"log-driver": "syslog"
}
您可以通过在docker service create
命令中传递--log-driver
和--log-opts
标志,强制单个服务使用不同的日志驱动程序。这些标志将覆盖daemon.json
中设置的任何内容。
服务日志要求应用程序以PID 1运行,并将日志发送到STDOUT,将错误发送到STDERR。日志驱动程序将这些"日志"转发到通过日志驱动程序配置的位置。
以下docker service logs
命令显示了名为svc1
的服务中所有副本的日志,该服务经历了一些启动副本失败的情况。
perl
$ docker service logs svc1
svc1.1.zhc3cjeti9d4@wrk2 | [emerg] 1#1: host not found...
svc1.1.zhc3cjeti9d4@wrk2 | nginx: [emerg] host not found..
svc1.1.6m1nmbzmwh2d@wrk2 | [emerg] 1#1: host not found...
svc1.1.6m1nmbzmwh2d@wrk2 | nginx: [emerg] host not found..
svc1.1.1tmya243m5um@mgr1 | 10.255.0.2 "GET / HTTP/1.1" 302
输出被裁剪以适应页面,但您可以看到显示了所有三个服务副本的日志(两个失败的副本和一个正在运行的副本)。每一行都以副本的名称开头,其中包括服务名称、副本编号、副本ID和其计划运行的主机的名称。之后是日志输出。
很难看出来,因为它被裁剪以适应书籍,但看起来前两个副本失败是因为它们尝试连接到另一个仍在启动的服务。
您可以跟踪日志(--follow)、尾随日志(--tail),以及获取额外的详细信息(--details)。
备份和恢复一个Swarm
备份一个Swarm是备份控制平面的过程,可以在发生灾难性故障或数据损坏时用于恢复Swarm。从备份中恢复Swarm的情况非常罕见。然而,对于业务关键环境,始终应准备好最坏的情况。
您可能会问,如果控制平面是复制和高可用(HA)的,为什么需要备份。要回答这个问题,考虑这样的情况:恶意行为者删除了Swarm上的所有Secrets。在这种情况下,HA无法帮助,因为删除操作会自动复制到所有管理节点。在这种情况下,高度可用的复制集群存储正在反对您 - 快速传播删除操作。您唯一的恢复选项是要么从存储库中的副本重新创建已删除的对象,例如vault或源代码存储库,要么尝试从最近的备份中进行恢复。
以声明方式管理Swarm和应用程序是防止需要从备份中恢复的需求的绝佳方法。例如,将配置对象存储在Swarm之外的版本控制存储库中将为您提供重新部署网络、服务、Secrets和其他对象等选项。
无论如何,让我们看看如何备份Swarm。
备份一个Swarm
Swarm的配置和状态存储在每个管理节点的/var/lib/docker/swarm目录中。这包括Raft日志键、覆盖网络、Secrets、Configs、Services等内容。Swarm备份是该目录中所有文件的副本。
由于该目录的内容被复制到所有管理节点,因此可以从多个管理节点执行备份。但是,由于在该过程中必须停止Docker守护程序,因此最好从非领导管理节点执行备份。这是因为在领导节点上停止Docker将启动领导者选举。您还应该在业务的安静时间执行备份,因为在备份过程中停止管理节点会增加Swarm在备份期间如果另一个管理节点失败,可能失去法定人数(quorum)的风险。
在开始备份之前,请创建以下网络。我们将在执行恢复后的步骤中检查这一点。
sql
$ docker network create -d overlay unimatrix01
我们即将执行的程序是一个高风险的程序,仅用于演示目的。您需要根据生产环境进行调整。您可能还需要在命令前加上sudo。
- 在非领导管理节点上停止Docker。 如果在节点上运行任何容器或服务副本,则此操作可能会停止它们。但是,如果您一直在跟随操作,您的管理节点不会运行任何应用程序容器。如果锁定了Swarm,请确保有Swarm解锁密钥的副本。
arduino
$ service docker stop
- 备份Swarm配置。 此示例使用Linux的tar工具执行文件复制,将其作为备份。您可以随意使用其他工具。
vbnet
$ tar -czvf swarm.bkp /var/lib/docker/swarm/
tar: Removing leading `/' from member names
/var/lib/docker/swarm/
/var/lib/docker/swarm/docker-state.json
/var/lib/docker/swarm/state.json
<Snip>
- 验证备份文件是否存在
shell
$ ls -l
-rw-r--r-- 1 root root 450727 May 22 12:34 swarm.bkp
在现实世界中,您应该根据公司的备份保留政策存储和轮换此备份。
此时,集群已备份,您可以重新启动节点上的 Docker。
- 重启Docker
ruby
$ service docker restart
- 解锁 Swarm 以允许重新启动的管理节点加入。只有在您的 Swarm 被锁定时才需要执行此步骤。如果您忘记了 Swarm 解锁密钥,可以在不同的管理节点上运行 docker swarm unlock-key 命令。
markdown
$ docker swarm unlock
Please enter unlock key:
恢复 Swarm
从备份还原 Swarm 仅适用于 Swarm 已损坏、丢失或无法从配置文件副本中恢复对象的情况。
您将需要 swarm.bkp 文件以及您的 Swarm 解锁密钥的副本(如果您的 Swarm 已锁定)。
要使恢复操作成功,必须满足以下要求:
- 只能将恢复操作执行到与执行备份的 Docker 版本相同的节点上。
- 只能将恢复操作执行到与执行备份的节点具有相同 IP 地址的节点上。
在执行备份的管理节点上执行该操作。您可能需要在命令前加上 sudo。
- 在管理节点上停止 Docker。
arduino
$ service docker stop
- 删除 Swarm 配置。
shell
$ rm -r /var/lib/docker/swarm
此时,管理节点已关闭,并准备好进行还原操作。
- 从备份文件中还原 Swarm 配置,并验证文件是否正常还原。在本示例中,我们将从名为 swarm.bkp 的压缩 tar 文件中还原。还原到根目录是必需的,因为备份包括了原始文件的完整路径。在您的环境中可能会有所不同。
shell
$ tar -zxvf swarm.bkp -C /
$ ls /var/lib/docker/swarm
certificates docker-state.json raft state.json worker
- 启动 Docker。
ruby
$ service docker start
- 使用 Swarm 解锁密钥解锁您的 Swarm。
vbnet
$ docker swarm unlock
Please enter unlock key: <your key>
- 使用备份的配置初始化一个新的 Swarm。确保在执行还原操作的节点上使用适当的 IP 地址。
sql
$ docker swarm init --force-new-cluster \
--advertise-addr 10.0.0.1:2377 \
--listen-addr 10.0.0.1:2377
Swarm initialized: current node (jhsg...3l9h) is now a manager.
- 检查 unimatrix01 网络是否作为操作的一部分恢复。
shell
$ docker network ls
NETWORK ID NAME DRIVER SCOPE
z21s5v82by8q unimatrix01 overlay swarm
恭喜,Swarm 已经恢复。
- 添加新的管理节点和工作节点,并进行新的备份。 记得定期和彻底测试这个过程。在需要的时候,您不希望它失败。
Docker Swarm - 命令
docker swarm init
:创建一个新的 Swarm。运行此命令的节点将成为第一个管理节点,并切换到 Swarm 模式。docker swarm join-token
:用于查看加入节点到 Swarm 所需的命令和令牌。使用docker swarm join-token manager
命令查看加入新管理节点所需的命令,使用docker swarm join-token worker
命令查看加入新工作节点所需的命令。务必保护好这些加入令牌的安全性。docker node ls
:列出 Swarm 中的所有节点,包括哪些是管理节点以及哪个是 leader。docker service create
:创建一个新的服务。docker service ls
:列出正在运行的服务,并提供有关服务状态和运行的副本数量的基本信息。docker service ps <service>
:提供有关单个服务副本的详细信息。docker service inspect
:提供有关服务的非常详细的信息。它接受--pretty
标志,以返回最重要的信息。docker service scale
:允许您增加或减少服务中副本的数量。docker service update
:允许您更新正在运行的服务的许多属性。docker service logs
:允许您查看服务的日志。docker service rm
:删除 Swarm 中的一个服务。请谨慎使用,因为它将删除所有服务副本,而不会要求确认。