MinIO数据导出

最近公司里需要将生产环境MinIO数据导出来一份,用于后续工作。导出的过程中尝试了三种方法(最终选择了方法三),内容如下:

方法一:MinIO Web控制台界面下载(适用于少量文件)

通过浏览器访问MinIO服务(http:// :9000),进入对应的Bucket和文件夹,选择对应文件,点击下载。

注意:MinIO 控制台 不支持文件夹整体下载,文件夹只能展开后逐个选择其下的文件进行下载。

方法二:使用python脚本批量导出文件导出

可以用 Python 编写一个脚本,批量下载 MinIO 某个 bucket 中的所有对象(文件)或者某个文件夹中的图片,保存到本地。MinIO 兼容 S3 协议,所以可以使用官方的 boto3 库来操作。

步骤:

  1. 安装依赖:boto3

  2. 配置MinIO地址与访问密钥

  3. 使用 boto3 连接MinIO

  4. 遍历bucket中所有对象并下载

    import boto3
    from botocore.client import Config
    import os

    ====== 配置 MinIO ======

    minio_endpoint = "http://127.0.0.1:9000" # MinIO 服务地址
    access_key = "admin" # 你的 Access Key
    secret_key = "admin" # 你的 Secret Key
    bucket_name = "bucket-test" # 要下载的 bucket 名称
    download_dir = "F:\minio_download_test" # 本地保存目录
    prefix = "fence-manual-capture" # 要下载的文件夹

    ====== 创建本地目录 ======

    os.makedirs(download_dir, exist_ok=True)

    ====== 创建 MinIO 客户端 ======

    s3 = boto3.client('s3',
    endpoint_url=minio_endpoint,
    aws_access_key_id=access_key,
    aws_secret_access_key=secret_key,
    config=Config(signature_version='s3v4'),
    region_name='us-east-1')

    ====== 获取并下载所有对象 ======

    paginator = s3.get_paginator('list_objects_v2')
    pages = paginator.paginate(Bucket=bucket_name,Prefix=prefix)

    for page in pages:
    if 'Contents' in page:
    for obj in page['Contents']:
    key = obj['Key']
    local_path = os.path.join(download_dir, key)

    复制代码
             # 创建本地子目录(如果对象名中含有路径)
             os.makedirs(os.path.dirname(local_path), exist_ok=True)
    
             print(f"正在下载: {key} -> {local_path}")
             s3.download_file(bucket_name, key, local_path)

    print("所有文件下载完成!")

方法三:使用MinIO Client(mc)批量导出(推荐)

MinIO官方提供了命令行工具mc,支持同步和下载。

官方文档:https://min.io/docs/minio/linux/reference/minio-mc.html

1.安装mc:

复制代码
wget https://dl.min.io/client/mc/release/linux-amd64/mc
chmod +x mc
sudo mv mc /usr/local/bin/
  1. 配置连接MinIO:

    mc alias set myminio http://<MINIO_HOST>:<PORT> <ACCESS_KEY> <SECRET_KEY>
    #例如 mc alias set myminio http://127.0.0.1:9000 minioadmin minioadmin

3.下载桶中的数据到本地

复制代码
mc mirror myminio/mybucket ./local-folder

这条命令会把 mybucket 中的所有文件递归下载到当前文件夹 ./local-folder 中。

可选参数:

  • --overwrite 强制覆盖本地已有文件
  • --remove 会删除本地目标中不在源中的文件(慎用)
  • --continue:跳过失败项,继续同步,不中断。
相关推荐
休息一下接着来5 天前
MinIO 分布式模式与纠删码
分布式·minio
wL魔法师7 天前
minio大文件断点续传
minio
wL魔法师9 天前
minio 文件批量下载
minio
Kookoos12 天前
多模联邦查询网关:ABP + Trino/Presto 聚合跨源数据
minio·presto·trino·数据网关·abp vnext·join优化
冷冷的菜哥15 天前
ASP.NET Core上传文件到minio
后端·asp.net·上传·asp.net core·minio
前端_yu小白1 个月前
大文件上传解决方案
minio·大文件上传·分片上传
FC_nian1 个月前
基于Spring Boot的Minio图片定时清理实践总结
spring boot·线程池·minio·定时任务·corn
java坤坤2 个月前
GoLand 项目从 0 到 1:第三天 —— 图数据库版本管理方案调研与中间件部署
neo4j·minio
HANFAN2 个月前
.NET4通过HTTP操作MINIO
.net·minio
DevOps0082 个月前
将 RustFS 用作 GitLab 对象存储后端
rust·gitlab·minio·分布式存储·s3·rustfs