docker cp 传文件,使用 docker exec 结合 tar 流传输,效率更高且能保留权限

docker cp 传文件,使用 docker exec 结合 tar 流传输,效率更高且能保留权限

一、概述

相比于 docker cp,使用 docker exec 结合 tar 流式传输是更高级、更高效且更可靠的文件传输方式。

这种方式利用了 Linux 管道(Pipe)的特性,直接在内存中完成数据的打包和解包,避免了在磁盘上生成中间文件,同时也完美保留了文件的权限、时间戳和目录结构。

以下是具体的使用方法和示例:

二、核心原理

bash 复制代码
docker exec [源容器] tar -cf - [源路径] | tar -xf - -C [本地目标路径]
  • tar -cf -- 代表标准输出(stdout),表示将打包的数据流直接输出到管道,而不是写入磁盘文件。
  • |:管道,将前一个命令的输出作为后一个命令的输入。
  • tar -xf -:从标准输入(stdin)读取数据流进行解包。

三、具体使用场景与示例

场景一:将容器内的文件/目录拷贝到宿主机(下载)

这是最常用的场景,比 docker cp 更快,且能保留权限。

  • 需求: 将容器 my-nginx 内的 /etc/nginx/conf.d 目录完整下载到本地的 ./backup 目录中。

    bash 复制代码
    # 创建本地接收目录
    mkdir -p ./backup
    
    # 执行流式拷贝
    docker exec my-nginx tar -cf - /etc/nginx/conf.d | tar -xf - -C ./backup
  • 优势:

    • 速度快: 省去了在容器内生成 tar 文件的磁盘写入时间。
    • 保留权限: -p 参数(通常默认包含)会自动保留文件的 UID/GID 和读写权限。
    • 路径处理: 不会出现 docker cp 那种因为斜杠导致的目录嵌套问题。

场景二:将宿主机的文件拷贝到容器内(上传)

这比 docker cp 上传更高效,且能更好地控制解压路径。

  • 需求: 将本地修改好的 default.conf 配置文件上传到容器的 /etc/nginx/conf.d/ 目录下。

    bash 复制代码
    # 将本地文件打包并通过管道发送给容器内的 tar 进行解包
    tar -cf - ./default.conf | docker exec -i my-nginx tar -xf - -C /etc/nginx/conf.d
  • 注意: 这里使用了 docker exec -i(保持标准输入打开),以便接收管道传入的数据。

场景三:跨容器直接拷贝(无需宿主机中转)

这是 docker cp 完全做不到的事情,利用 tar 流可以在两个容器之间直接传输数据。

  • 需求: 将容器 A 的数据直接迁移到容器 B,不经过宿主机磁盘。

    bash 复制代码
    docker exec container_a tar -cf - /data/backup/ | docker exec -i container_b tar -xf - -C /data/
  • 优势: 极大节省了宿主机磁盘 I/O 和空间,传输速度仅受限于内存带宽。


四、进阶:带压缩的传输(适合大文件/慢网络)

如果传输的数据量极大,且宿主机与 Docker Daemon 之间的连接较慢(例如通过网络连接远程 Docker Host),可以加入压缩。

  • 命令(使用 gzip 压缩):

    bash 复制代码
    # 下载并压缩传输
    docker exec my-container tar -czf - /large-folder/ | tar -xzf - -C ./local-path
  • 说明: 加入 -z 参数会启用 gzip 压缩。虽然会增加 CPU 开销,但能显著减少传输的数据量,总体时间可能反而更短。

五、总结

特性 docker cp docker exec + tar
中间文件 需要在容器/宿主机生成临时文件 无中间文件(内存流式处理)
传输速度 较慢(涉及磁盘读写) 快(直接内存管道传输)
权限保留 容易丢失或错乱 完美保留 UID/GID 和权限
跨容器传输 不支持 支持
使用难度 简单 稍微复杂(需记忆 tar 参数)

建议: 对于简单的单个文件查看,用 docker cp 没问题;但对于目录同步、数据迁移或自动化脚本,强烈推荐使用 docker exec + tar 组合。

相关推荐
燃于AC之乐2 小时前
【Linux系统编程】进程地址空间完全指南:页表、写时拷贝与虚拟内存管理
linux·操作系统·虚拟内存·进程地址空间
网硕互联的小客服2 小时前
站群服务器里的8C/4C/2C/1C有什么区别?选择哪个比较好?
运维·服务器·网络
_OP_CHEN2 小时前
【Linux系统编程】(二十三)从块到块组:Ext2 文件系统核心架构的初步认识
linux·操作系统·文件系统·c/c++·ext2文件系统·磁盘分区·块组
摆烂z2 小时前
k8s频繁拉取镜像导致磁盘占满imagefs
云原生·容器·kubernetes
m0_748244962 小时前
【Linux 系列】Linux 命令/快捷键详解
linux·运维·服务器
摸鱼仙人~2 小时前
OpenManus沙箱实现解析:从Docker容器到轻量替代方案
docker·容器·eureka
德迅云安全—珍珍2 小时前
租用的服务器太卡怎么办?怎么优化
运维·服务器
showker2 小时前
Mac mini-macOS Tahoe 26.1-安装ftp服务-用户名密码都对,就是提示530 login incorrect
linux·服务器·数据库
未来之窗软件服务2 小时前
服务器运维(二十八)阿里云清理服务器瘦身降低漏洞风险—东方仙盟
linux·运维·服务器·仙盟创梦ide·东方仙盟