docker学习3:docker是怎么实现的?

前面我们学习了 Docker 镜像、容器的各种操作,dockerfile 的编写,dockerignore 和镜像的多阶段构建。

是不是感觉 Docker 也没多少东西?

确实,Docker 用起来还是很简单的,学习成本不高。

那它是怎么实现的呢?

Docker 容器跑起来就像一个独立的系统一样,它是怎么做到的?

如果网页上有两份 aaa、bbb 变量,我们怎么保证它们不冲突呢?

namespace 呀:

变成 xxx.aaa、xxx.bbb 和 yyy.aaa、yyy.bbb 就不冲突了。

Docker 在一个操作系统上实现多个独立的容器也是这种思路。

linux 操作系统提供了 namespace 机制,可以给进程、用户、网络等分配一个命名空间,这个命名空间下的资源都是独立命名的。

假如你开了一家共享网吧,一台 Linux 服务器就箱单与整栋网吧大楼,所有进程就相当于上网的人。

正常情下所有人共用屏幕、键盘、网络、文件,但是这样会乱套了。

于是,Linux 主要给进程隔离这 6 样东西:

  1. PID 命名空间 :相当于包间里的你,以为自己是 1 号进程(系统老大),其实外面真实系统里你只是个普通进程。让容器觉得自己是独立系统
  2. MNT 命名空间 : 你看到的 C 盘、D 盘、文件系统,都是包间给你 "画" 出来的。容器有自己独立目录,不影响宿主机
  3. NET 命名空间 :你有自己的 IP、自己的端口、自己的网卡,和外面完全隔离。Docker 能有独立端口、独立网络
  4. UTS 命名空间:你可以自己起主机名,别人看不到,也不冲突。
  5. USER 命名空间 :你在包间里是 root(管理员),但在真实系统里权限很小。 安全!容器逃逸很难
  6. IPC 命名空间:进程之间聊天、共享内存,只在包间内有效,外面听不见。

通过这 6 种命名空间,Docker 就实现了独立的容器,在容器内运行的代码就像在一个独立的系统里跑一样。

但是只有命名空间的隔离还不够,还得对资源做限制。

比如一个容器占用了太多的资源,那就会导致别的容器受影响。

怎么能限制容器的资源访问呢?

这就需要 linux 操作系统的另一种机制:Control Group。

创建一个 Control Group 可以给它指定参数,比如 cpu 用多少、内存用多少、磁盘用多少,然后加到这个组里的进程就会受到这个限制。

这样,创建容器的时候先创建一个 Control Group,指定资源的限制,然后把容器进程加到这个 Control Group 里,就不会有容器占用过多资源的问题了。

那这样就完美了么?

其实还有一个问题:每个容器都是独立的文件系统,相互独立,而这些文件系统之间可能很大部分都是一样的,同样的内容占据了很大的磁盘空间,会导致浪费

所以 Docker 设计了一种分层机制:

每一层都是不可修改的,也叫做镜像。

要修改就创建个新的层:

然后通过一种叫做 UnionFS 的机制把这些层合并起来,变成一个文件系统:

这样如果有多个容器内做了文件修改,只要创建不同的层即可,底层的基础镜像是一样的。

我们写的这个 Dockerfile,每一行指令都会生成一层镜像:

当然,很多都是一层层通过 FROM 继承下来的。

Docker 通过这种分层的镜像存储,极大的减少了文件系统的磁盘占用。

哪里看出来的呢?

比如 nest 的镜像有 1g 多:

我本地两个 nest 镜像,它们都继承了 node 镜像,这两个合起来有 2g 的存储空间么?

没有,因为下面的镜像层是公用的:

如果有 10 个这种类似的镜像,之前需要 10g。现在呢?可能不到 2g 就够了。

这就是分层存储的魅力

而且还可以把这些镜像 push 到 registry 镜像仓库,别人拉下来也可以直接用。

但镜像生成之后是不可修改的,那为啥我们可以在容器内写文件呢?

因为容器跑起来会给他多加一个可写层,或者叫容器层:

这样容器就能在这里一层写文件了。

当然,再跑一个容器会创建一个新的可写层,另一个容器的可写层的数据就丢了。

所以 Docker 设计了挂载机制,可以挂载数据卷到这个可写层上去。

这个数据卷是可以持久化的,再跑个新容器,依然可以把这个 volume 挂上去。

这就是数据卷的作用。

回顾一下 Docker 实现原理的三大基础技术:

  • Namespace:实现各种资源的隔离
  • Control Group:实现容器进程的资源访问限制
  • UnionFS:实现容器文件系统的分层存储,镜像合并

都是缺一不可的。

Docker 的实现原理依赖 linux 的 Namespace、Control Group、UnionFS 这三种机制。

Namespace 做资源隔离,Control Group 做容器的资源限制,UnionFS 做文件系统的分层镜像存储、镜像合并。

我们通过 dockerfile 描述镜像构建的过程,每一条指令都是一个镜像层。

镜像通过 docker run 就可以跑起来,对外提供服务,这时会添加一个可写层(容器层)。

挂载一个 volume 数据卷到 Docker 容器,就可以实现数据的持久化。

这就是 Docker 的实现原理。

相关推荐
小p1 天前
docker学习: 2. 构建镜像Dockerfile
docker
小p2 天前
docker学习: 1. docker基本使用
docker
崔小汤呀2 天前
Docker部署Nacos
docker·容器
缓解AI焦虑2 天前
Docker + K8s 部署大模型推理服务:资源划分与多实例调度
docker·容器
1candobetter3 天前
Docker Compose Build 与 Up 的区别:什么时候必须重建镜像
docker·容器·eureka
シ風箏3 天前
MySQL【部署 04】Docker部署 MySQL8.0.32 版本(网盘镜像及启动命令分享)
数据库·mysql·docker
BugShare3 天前
继《小爱音响》详细说下怎么部署,尤其是关于Docker部分
docker·nas·xiaomusic
小马爱打代码3 天前
Docker:完全指南从入门到精通
运维·docker·容器