MinIO数据导出

最近公司里需要将生产环境MinIO数据导出来一份,用于后续工作。导出的过程中尝试了三种方法(最终选择了方法三),内容如下:

方法一:MinIO Web控制台界面下载(适用于少量文件)

通过浏览器访问MinIO服务(http:// :9000),进入对应的Bucket和文件夹,选择对应文件,点击下载。

注意:MinIO 控制台 不支持文件夹整体下载,文件夹只能展开后逐个选择其下的文件进行下载。

方法二:使用python脚本批量导出文件导出

可以用 Python 编写一个脚本,批量下载 MinIO 某个 bucket 中的所有对象(文件)或者某个文件夹中的图片,保存到本地。MinIO 兼容 S3 协议,所以可以使用官方的 boto3 库来操作。

步骤:

  1. 安装依赖:boto3

  2. 配置MinIO地址与访问密钥

  3. 使用 boto3 连接MinIO

  4. 遍历bucket中所有对象并下载

    import boto3
    from botocore.client import Config
    import os

    ====== 配置 MinIO ======

    minio_endpoint = "http://127.0.0.1:9000" # MinIO 服务地址
    access_key = "admin" # 你的 Access Key
    secret_key = "admin" # 你的 Secret Key
    bucket_name = "bucket-test" # 要下载的 bucket 名称
    download_dir = "F:\minio_download_test" # 本地保存目录
    prefix = "fence-manual-capture" # 要下载的文件夹

    ====== 创建本地目录 ======

    os.makedirs(download_dir, exist_ok=True)

    ====== 创建 MinIO 客户端 ======

    s3 = boto3.client('s3',
    endpoint_url=minio_endpoint,
    aws_access_key_id=access_key,
    aws_secret_access_key=secret_key,
    config=Config(signature_version='s3v4'),
    region_name='us-east-1')

    ====== 获取并下载所有对象 ======

    paginator = s3.get_paginator('list_objects_v2')
    pages = paginator.paginate(Bucket=bucket_name,Prefix=prefix)

    for page in pages:
    if 'Contents' in page:
    for obj in page['Contents']:
    key = obj['Key']
    local_path = os.path.join(download_dir, key)

    复制代码
             # 创建本地子目录(如果对象名中含有路径)
             os.makedirs(os.path.dirname(local_path), exist_ok=True)
    
             print(f"正在下载: {key} -> {local_path}")
             s3.download_file(bucket_name, key, local_path)

    print("所有文件下载完成!")

方法三:使用MinIO Client(mc)批量导出(推荐)

MinIO官方提供了命令行工具mc,支持同步和下载。

官方文档:https://min.io/docs/minio/linux/reference/minio-mc.html

1.安装mc:

复制代码
wget https://dl.min.io/client/mc/release/linux-amd64/mc
chmod +x mc
sudo mv mc /usr/local/bin/
  1. 配置连接MinIO:

    mc alias set myminio http://<MINIO_HOST>:<PORT> <ACCESS_KEY> <SECRET_KEY>
    #例如 mc alias set myminio http://127.0.0.1:9000 minioadmin minioadmin

3.下载桶中的数据到本地

复制代码
mc mirror myminio/mybucket ./local-folder

这条命令会把 mybucket 中的所有文件递归下载到当前文件夹 ./local-folder 中。

可选参数:

  • --overwrite 强制覆盖本地已有文件
  • --remove 会删除本地目标中不在源中的文件(慎用)
  • --continue:跳过失败项,继续同步,不中断。
相关推荐
DevOps0084 天前
在 Azure Linux 上安装 RustFS
rust·minio·分布式存储·s3·rustfs
保持学习ing6 天前
day4--上传图片、视频
java·大数据·数据库·文件上传·minio·分布式文件系统·文件存储
执笔诉情殇〆7 天前
前后端分离(java) 和 Nginx在服务器上的完整部署方案(redis、minio)
java·服务器·redis·nginx·minio
X_taiyang189 天前
超越公有云:在裸金属服务器上构建低成本、高性能的静态资源服务
服务器·minio
牛马程序员‍11 天前
在线学堂-4.媒资管理模块(三)
minio·视频转码
RW~15 天前
Minio安装配置,桶权限设置,nginx代理 https minio
运维·nginx·https·minio
寂寞旅行1 个月前
MinIO社区版文件预览失效?一招解决
java·文件·minio
兰丰岐1 个月前
使用minio + iceberg-rest + amoro+ + trino搭建iceberg数据湖架构
数据湖·minio·trino·amoro·apache amoro·iceberg rest catalog·iceberg rest
Bruk.Liu1 个月前
《Minio 分片上传实现(基于Spring Boot)》
前端·spring boot·minio