最近公司里需要将生产环境MinIO数据导出来一份,用于后续工作。导出的过程中尝试了三种方法(最终选择了方法三),内容如下:
方法一:MinIO Web控制台界面下载(适用于少量文件)
通过浏览器访问MinIO服务(http:// :9000),进入对应的Bucket和文件夹,选择对应文件,点击下载。
注意:MinIO 控制台 不支持文件夹整体下载,文件夹只能展开后逐个选择其下的文件进行下载。
方法二:使用python脚本批量导出文件导出
可以用 Python 编写一个脚本,批量下载 MinIO 某个 bucket 中的所有对象(文件)或者某个文件夹中的图片,保存到本地。MinIO 兼容 S3 协议,所以可以使用官方的 boto3 库来操作。
步骤:
-
安装依赖:boto3
-
配置MinIO地址与访问密钥
-
使用 boto3 连接MinIO
-
遍历bucket中所有对象并下载
import boto3
from botocore.client import Config
import os====== 配置 MinIO ======
minio_endpoint = "http://127.0.0.1:9000" # MinIO 服务地址
access_key = "admin" # 你的 Access Key
secret_key = "admin" # 你的 Secret Key
bucket_name = "bucket-test" # 要下载的 bucket 名称
download_dir = "F:\minio_download_test" # 本地保存目录
prefix = "fence-manual-capture" # 要下载的文件夹====== 创建本地目录 ======
os.makedirs(download_dir, exist_ok=True)
====== 创建 MinIO 客户端 ======
s3 = boto3.client('s3',
endpoint_url=minio_endpoint,
aws_access_key_id=access_key,
aws_secret_access_key=secret_key,
config=Config(signature_version='s3v4'),
region_name='us-east-1')====== 获取并下载所有对象 ======
paginator = s3.get_paginator('list_objects_v2')
pages = paginator.paginate(Bucket=bucket_name,Prefix=prefix)for page in pages:
if 'Contents' in page:
for obj in page['Contents']:
key = obj['Key']
local_path = os.path.join(download_dir, key)# 创建本地子目录(如果对象名中含有路径) os.makedirs(os.path.dirname(local_path), exist_ok=True) print(f"正在下载: {key} -> {local_path}") s3.download_file(bucket_name, key, local_path)
print("所有文件下载完成!")
方法三:使用MinIO Client(mc)批量导出(推荐)
MinIO官方提供了命令行工具mc,支持同步和下载。
官方文档:https://min.io/docs/minio/linux/reference/minio-mc.html
1.安装mc:
wget https://dl.min.io/client/mc/release/linux-amd64/mc
chmod +x mc
sudo mv mc /usr/local/bin/
-
配置连接MinIO:
mc alias set myminio http://<MINIO_HOST>:<PORT> <ACCESS_KEY> <SECRET_KEY>
#例如 mc alias set myminio http://127.0.0.1:9000 minioadmin minioadmin
3.下载桶中的数据到本地
mc mirror myminio/mybucket ./local-folder
这条命令会把 mybucket 中的所有文件递归下载到当前文件夹 ./local-folder 中。
可选参数:
- --overwrite 强制覆盖本地已有文件
- --remove 会删除本地目标中不在源中的文件(慎用)
- --continue:跳过失败项,继续同步,不中断。