MinIO数据导出

深紫色的三北六号2025-07-17 18:18

最近公司里需要将生产环境MinIO数据导出来一份，用于后续工作。导出的过程中尝试了三种方法（最终选择了方法三），内容如下：

方法一：MinIO Web控制台界面下载（适用于少量文件）

通过浏览器访问MinIO服务（http:// :9000），进入对应的Bucket和文件夹，选择对应文件，点击下载。

注意：MinIO 控制台不支持文件夹整体下载，文件夹只能展开后逐个选择其下的文件进行下载。

方法二：使用python脚本批量导出文件导出

可以用 Python 编写一个脚本，批量下载 MinIO 某个 bucket 中的所有对象（文件）或者某个文件夹中的图片，保存到本地。MinIO 兼容 S3 协议，所以可以使用官方的 boto3 库来操作。

步骤：

安装依赖：boto3
配置MinIO地址与访问密钥
使用 boto3 连接MinIO
遍历bucket中所有对象并下载

import boto3
from botocore.client import Config
import os

====== 配置 MinIO ======

minio_endpoint = "http://127.0.0.1:9000" # MinIO 服务地址
access_key = "admin" # 你的 Access Key
secret_key = "admin" # 你的 Secret Key
bucket_name = "bucket-test" # 要下载的 bucket 名称
download_dir = "F:\minio_download_test" # 本地保存目录
prefix = "fence-manual-capture" # 要下载的文件夹

====== 创建本地目录 ======

os.makedirs(download_dir, exist_ok=True)

====== 创建 MinIO 客户端 ======

s3 = boto3.client('s3',
endpoint_url=minio_endpoint,
aws_access_key_id=access_key,
aws_secret_access_key=secret_key,
config=Config(signature_version='s3v4'),
region_name='us-east-1')

====== 获取并下载所有对象 ======

paginator = s3.get_paginator('list_objects_v2')
pages = paginator.paginate(Bucket=bucket_name,Prefix=prefix)

for page in pages:
if 'Contents' in page:
for obj in page['Contents']:
key = obj['Key']
local_path = os.path.join(download_dir, key)
复制代码
```
         # 创建本地子目录（如果对象名中含有路径）
         os.makedirs(os.path.dirname(local_path), exist_ok=True)

         print(f"正在下载: {key} -> {local_path}")
         s3.download_file(bucket_name, key, local_path)
```
print("所有文件下载完成！")

方法三：使用MinIO Client（mc）批量导出（推荐）

MinIO官方提供了命令行工具mc，支持同步和下载。

官方文档：https://min.io/docs/minio/linux/reference/minio-mc.html

1.安装mc：

复制代码

wget https://dl.min.io/client/mc/release/linux-amd64/mc
chmod +x mc
sudo mv mc /usr/local/bin/

配置连接MinIO：

mc alias set myminio http://<MINIO_HOST>: <ACCESS_KEY> <SECRET_KEY>
#例如 mc alias set myminio http://127.0.0.1:9000 minioadmin minioadmin

3.下载桶中的数据到本地

复制代码

mc mirror myminio/mybucket ./local-folder

这条命令会把 mybucket 中的所有文件递归下载到当前文件夹 ./local-folder 中。

可选参数：

--overwrite 强制覆盖本地已有文件
--remove 会删除本地目标中不在源中的文件（慎用）
--continue：跳过失败项，继续同步，不中断。

上一篇：ABP VNext + EF Core 二级缓存：提升查询性能

下一篇：火山引擎：字节跳动的技术赋能初解

热门推荐

01GitHub 镜像站点 02幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 03AI科技热点日报 | 2026年07月01日 042026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 05GPT-5.5 对比 GPT-5.6 Sol、Terra、Luna：官方性能数据与选型分析 062026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 082026 年 AI 编程工具终极横评：Cursor vs Claude Code vs Copilot vs Windsurf 092026 AI 编程工具终极实战指南：Cursor vs Claude Code vs Copilot，开发者该怎么选？10几个好用的ip纯净度检测网站