用 Python 实现 Docker 镜像批量推送(带进度条)

背景

在本地调试或搭建漏洞复现环境时,我们经常会使用到各种公开的 Docker 镜像(如 vulhub/jboss/portainer/ 等)。但出于以下原因,你可能需要将这些镜像迁移到自己的 Docker Hub 仓库

  • 防止官方仓库删除或无法访问
  • 在隔离环境中部署
  • 长期保存当前使用的镜像版本
  • 配合自己的 docker-compose.yml 统一管理

手动一个个 docker tag + docker push 很繁琐,尤其当镜像数量多、体积大时。因此我写了一个 Python 脚本,它可以:

  • ✅ 自动读取当前所有容器(包括停止的)使用的镜像
  • ✅ 去除原始仓库前缀(如 vulhub/),打上自己的仓库标签
  • ✅ 带 实时进度条 (基于 tqdm)显示每一层的上传进度
  • 增量上传:已存在的层会自动跳过,不会重复消耗流量

脚本代码

将以下代码保存为 push_images_with_progress.py

python 复制代码
#!/usr/bin/env python3
# -*- coding: utf-8 -*-

import docker
import sys
from tqdm import tqdm

# ========== 配置 ==========
DOCKER_USERNAME = "rockmelodies"   # 你的 Docker Hub 用户名
# =========================

client = docker.from_env()

def get_unique_images_from_all_containers():
    """获取所有容器(包括停止的)使用的镜像名(唯一)"""
    containers = client.containers.list(all=True)
    images = set()
    for c in containers:
        # 镜像名格式:repository:tag
        image_full = c.image.tags[0] if c.image.tags else f"{c.image.id[:12]}"
        images.add(image_full)
    return images

def short_image_name(full_name):
    """从 vulhub/nginx:1.11.13 提取 nginx:1.11.13"""
    # 去掉第一个 / 之前的所有内容
    if '/' in full_name:
        return full_name.split('/', 1)[-1]
    return full_name

def tag_and_push(image_full):
    """打标签并推送,显示进度条"""
    short = short_image_name(image_full)
    new_tag = f"{DOCKER_USERNAME}/{short}"
    
    print(f"\n🚀 处理镜像: {image_full}")
    print(f"   → 新标签: {new_tag}")
    
    # 1. 拉取原始镜像(确保本地存在)
    try:
        client.images.get(image_full)
    except docker.errors.ImageNotFound:
        print(f"   ⚠️ 本地未找到 {image_full},尝试拉取...")
        client.images.pull(image_full)
    
    # 2. 打标签
    img = client.images.get(image_full)
    img.tag(new_tag)
    
    # 3. 推送(带进度条)
    print("   ⬆️ 开始推送...")
    layers_progress = {}
    
    for line in client.images.push(new_tag, stream=True, decode=True):
        if 'id' in line and 'progressDetail' in line:
            layer_id = line['id']
            progress = line['progressDetail']
            total = progress.get('total')
            current = progress.get('current')
            
            if total and current:
                if layer_id not in layers_progress:
                    layers_progress[layer_id] = tqdm(
                        total=total, unit='B', unit_scale=True,
                        desc=f"    层 {layer_id[:12]}", leave=False
                    )
                layers_progress[layer_id].update(current - layers_progress[layer_id].n)
                if current >= total:
                    layers_progress[layer_id].close()
                    del layers_progress[layer_id]
        elif 'status' in line:
            status = line['status']
            if 'already exists' in status.lower():
                tqdm.write(f"   ℹ️ {status}")
    
    print(f"   ✅ 推送完成: {new_tag}\n")

def main():
    print("🔍 获取所有容器使用的镜像...")
    images = get_unique_images_from_all_containers()
    if not images:
        print("❌ 没有找到任何容器镜像。")
        sys.exit(1)
    
    print(f"📋 找到 {len(images)} 个唯一镜像:")
    for img in images:
        print(f"   - {img}")
    
    for img in images:
        try:
            tag_and_push(img)
        except Exception as e:
            print(f"❌ 推送失败 {img}: {e}")
    
    print("\n🎉 所有镜像处理完毕!")

if __name__ == "__main__":
    main()

使用步骤

1. 安装依赖

bash 复制代码
pip install docker tqdm

如果提示 pip 未找到,请先确保 Python 环境正常(必要时使用 python -m ensurepip --upgrade)。

2. 登录 Docker Hub

bash 复制代码
docker login

输入你的 Docker ID个人访问令牌(推荐) 或密码。

3. 修改脚本中的用户名

DOCKER_USERNAME = "rockmelodies" 改为你自己的 Docker Hub 用户名。

4. 运行脚本

bash 复制代码
python3 push_images_with_progress.py

运行效果示例

复制代码
🔍 获取所有容器使用的镜像...
📋 找到 11 个唯一镜像:
   - vulhub/comfyui:3.39.1-with-manager
   - vulhub/webmin:1.910
   ...

🚀 处理镜像: vulhub/comfyui:3.39.1-with-manager
   → 新标签: rockmelodies/comfyui:3.39.1-with-manager
   ⬆️ 开始推送...
    层 a1b2c3d4e5f6: 45%|████▌     | 45.2M/100M [00:05<00:06, 8.2MB/s]
   ℹ️ Layer already exists
   ✅ 推送完成: rockmelodies/comfyui:3.39.1-with-manager

🎉 所有镜像处理完毕!

核心优势

🔁 增量上传(不会重复推送)

  • 脚本使用 docker.images.push(stream=True) 获取推送过程的实时输出。
  • Docker 底层采用分层存储 ,如果远程仓库已有某层(如之前推送过),会显示 Layer already exists 并直接跳过,不会重新传输数据。
  • 因此即使多次运行脚本,也不会浪费流量和时间

📊 精确进度条

  • 基于 tqdm,为每一个正在上传的镜像层绘制独立的进度条。
  • 实时显示已传输大小、总大小、传输速度。
  • 当层传输完成后进度条自动关闭。

🧠 自动提取镜像列表

  • 调用 Docker API 获取所有容器(all=True 包括已停止的)。
  • 自动去重,同一个镜像不会重复处理。
  • 无需手动维护镜像列表,适合动态环境。

🏷️ 智能打标签

  • 自动去除原始仓库前缀(如 vulhub/jboss/portainer/)。
  • 例如:vulhub/nginx:1.11.13你的用户名/nginx:1.11.13
  • 简洁且符合 Docker Hub 命名规范。

常见问题

Q1:推送时提示 denied: requested access to the resource is denied

A :没有登录或登录凭据无效。执行 docker login 并确认用户名/令牌正确。

Q2:脚本运行时卡住不动?

A:大型镜像的上传需要时间,进度条可能会短暂没有更新,实际仍在传输。请耐心等待。如果长时间无响应,检查网络连接。

Q3:我不想推送所有镜像,只想推送某几个怎么办?

A :可以修改 get_unique_images_from_all_containers() 函数,增加过滤逻辑;或直接在脚本中定义一个白名单列表。

Q4:推送完成后如何确认镜像在 Docker Hub 上?

A :登录 https://hub.docker.com/u/你的用户名 查看仓库列表。也可以执行 docker pull 你的用户名/镜像名:标签 测试。


扩展想法

  • 可以添加 --dry-run 模式,只显示将要推送的镜像而不实际执行。
  • 支持多个目标仓库(如同时推送到阿里云镜像仓库)。
  • 增加失败重试机制和日志记录。

总结

这个 Python 脚本让你可以用一条命令将本地所有运行过的 Docker 镜像完整迁移到自己的 Docker Hub 仓库,并实时看到推送进度。而且由于 Docker 分层的特性,重复执行也不会造成资源浪费。

如果你也在管理多个漏洞复现环境或自定义镜像,不妨试试这个脚本,让镜像迁移变得轻松又透明。


欢迎留言交流,如果你有更好的改进建议,也欢迎提出来!

相关推荐
2301_817672262 小时前
如何在 HTML 中正确使用 exif-js 库读取图片 EXIF 元数据
jvm·数据库·python
Olafur_zbj2 小时前
【python】PDF文件翻译
网络·python·pdf
2401_832635582 小时前
如何用 credentials 参数决定 Fetch 是否携带本地的 Cookie
jvm·数据库·python
实名上网宋凯宣2 小时前
dockerfile镜像-python文件
docker
粉嘟小飞妹儿2 小时前
mysql如何通过防火墙保护MySQL权限_MySQL网络层安全配置
jvm·数据库·python
2301_803538952 小时前
如何高效批量删除SQL数据_使用脚本分段删除降低压力
jvm·数据库·python
书到用时方恨少!2 小时前
Python 面向对象编程:从“过程清单”到“智能积木”的思维革命
开发语言·python·面向对象
2401_897190552 小时前
MySQL升级导致排序规则变化怎么处理_更新Collation配置
jvm·数据库·python
zhangchaoxies2 小时前
uni-app怎么动态生成二维码 uni-app利用插件生成分享码方法【技巧】
jvm·数据库·python