第十六篇:《Docker 安全基础:容器隔离与权限控制》

容器虽然共享宿主机内核,但 Docker 通过 Linux 命名空间(Namespace)实现资源隔离,通过 Cgroups 进行资源限制,从而提供了一定程度的安全性。然而,默认配置并非绝对安全:root 用户、特权容器、内核漏洞等风险依然存在。本文将讲解 Docker 的安全基石、常见攻击面,以及如何通过 Capability 限制、Seccomp、AppArmor、只读文件系统等实践来加固容器。

一、容器安全的基石:Linux 内核特性

二、默认安全机制分析

2.1 默认的 Capability 集合

Docker 启动容器时,即使以 root 用户运行,也只授予以下 Capabilities(可通过 docker inspect 查看):

CHOWN, DAC_OVERRIDE, FOWNER, FSETID, KILL, SETGID, SETUID, SETPCAP, NET_BIND_SERVICE, NET_RAW, SYS_CHROOT, MKNOD, AUDIT_WRITE, SETFCAP

被丢弃的危险 Capabilities(不授予):

SYS_ADMIN(挂载文件系统、加载内核模块等)

SYS_RAWIO(直接访问硬件)

SYS_PTRACE(调试其他进程)

NET_ADMIN(配置网络)

MAC_OVERRIDE(绕过 MAC 策略)

示例:容器内无法执行 mount 命令,因为缺少 SYS_ADMIN。

2.2 默认 Seccomp 配置

Seccomp 拦截危险系统调用,如 clone(未指定标志)、reboot、swapon、acct 等。默认配置通常足够安全。

2.3 默认 AppArmor / SELinux

Ubuntu/Debian 默认启用 AppArmor,Docker 会生成名为 docker-default 的策略。

CentOS/RHEL 默认使用 SELinux,容器进程被限制在特定域中。

三、常见容器安全风险

四、安全加固实践

4.1 以非 root 用户运行

dockerfile

在 Dockerfile 中创建用户

RUN useradd -m -u 1000 appuser

USER appuser

运行时也可指定:

bash 复制代码
docker run --user 1000:1000 ubuntu id

4.2 删除不必要的 Capabilities

bash 复制代码
# 删除 NET_RAW(禁止 ping 等原始套接字)
docker run --cap-drop=NET_RAW alpine ping 8.8.8.8  # 失败

# 只添加需要的 Cap(最小权限原则)
docker run --cap-add=NET_ADMIN --cap-drop=ALL alpine ...

4.3 禁止特权容器

绝不在生产环境使用 --privileged。如需访问设备,逐项添加相应 Capability。

bash 复制代码
docker run --privileged ...  # 禁止

4.4 使用只读根文件系统

防止容器内安装恶意软件或修改系统文件。

bash 复制代码
docker run --read-only -v /tmp:/tmp -v /var/run/... alpine

需要写入的目录单独挂载可写卷。

4.5 设置资源限制

bash 复制代码
docker run --memory=512m --cpus=1 --pids-limit=100 alpine

--pids-limit 限制进程数,防止 fork 炸弹。

4.6 不要挂载 Docker Socket

bash 复制代码
# 非常危险
docker run -v /var/run/docker.sock:/var/run/docker.sock ...

若必须(如监控工具),应严格限制权限并使用只读挂载。

4.7 使用安全扫描工具

bash 复制代码
docker scan nginx:latest   # 需要登录 Docker Hub

第三方工具:Trivy、Clair、Grype。

4.8 配置 Seccomp 自定义策略

bash 复制代码
docker run --security-opt seccomp=custom.json ...

示例 custom.json 允许所有系统调用(不推荐):

json

{"defaultAction": "SCMP_ACT_ALLOW"}

生产环境应基于默认配置,按需放行。

4.9 启用 AppArmor 或 SELinux

Docker 默认使用 docker-default 策略,无需额外操作。可自定义:

bash 复制代码
docker run --security-opt apparmor=my-profile ...

五、安全基准和工具

CIS Docker Benchmark:社区标准,可用于评估配置合规性。

Docker Bench Security:开源脚本检查最佳实践。

bash 复制代码
git clone https://github.com/docker/docker-bench-security.git
cd docker-bench-security
./docker-bench-security.sh

gVisor(Google):为容器提供独立内核,增强隔离。

Kata Containers:轻量虚拟机,强隔离。

六、实践:加固一个 Nginx 容器

bash 复制代码
docker run -d --name web \
  --cap-drop=ALL \
  --cap-add=NET_BIND_SERVICE \
  --read-only \
  --tmpfs /tmp:rw,noexec,nosuid,size=64m \
  --memory=128m \
  --cpus=0.5 \
  --pids-limit=100 \
  --security-opt=no-new-privileges:true \
  nginx:alpine
--cap-drop=ALL 删除所有 Capability,再单独添加 NET_BIND_SERVICE(允许绑定 80/443 端口)。

--security-opt=no-new-privileges 防止进程提升权限(如 setuid)。

七、监控和审计

使用 Falco 实时检测容器异常行为(如 shell 执行、敏感文件读写)。

启用 Docker 审计日志:auditctl -w /usr/bin/docker -k docker

八、小结

Docker 本身提供了多层次安全机制,但默认配置仍有风险。通过非 root 用户、最小 Capability、只读文件系统、资源限制、定期扫描镜像等实践,可以显著降低攻击面。记住:容器不是虚拟机,共享内核意味着内核漏洞可能影响所有容器。

相关推荐
Suroy5 小时前
DockerView-Go:用 Go 写一个终端 Docker 监控工具,顺便做了个 Web 仪表盘
docker
云恒要逆袭6 小时前
运行你的第一个Docker容器
后端·docker·容器
宋均浩1 天前
# Docker 镜像瘦身实战:从 1.2G 到 80MB 的五个优化步骤
ci/cd·docker
程序员老赵2 天前
10 分钟部署 OpenCode:Docker 一键安装,浏览器打开就能用 AI 写代码(附完整命令与排错)
docker·容器·ai编程
WangMingHua1112 天前
LM Studio Docker 部署——本地大模型一键启动
docker
冬奇Lab3 天前
Skill 系列(02):Skill 安全风险——三类攻击面的实战测试
人工智能·安全·开源
曲幽3 天前
别再用网页翻译看源码了!你的私人翻译神器LibreTranslate,部署避坑指南来了
python·docker·web·pot·translate·libretranslate·arogstranslate
武子康5 天前
调查研究-183 Apple container:Mac 上用轻量 VM 跑 Linux 容器,Swift 会改写本地容器体验吗?
docker·容器·apple
Aphasia3116 天前
VPN 与内网穿透
安全
Mr_愚人派7 天前
当"Claude"不再是 Claude:一次第三方 API 代理引发的 AI 身份伪造排查实录
人工智能·安全