rsync 大数据量同步中断问题

问题现象

使用 rsync 同步 TB 级目录(含数百万小文件),命令如下:

bash 复制代码
rsync -avz --delete --size-only --bwlimit=30M -e "ssh -p 19098" /src/ user@remote:/dest/

同步数小时后随机中断,报错:

lua 复制代码
rsync error: received SIGINT, SIGTERM, or SIGHUP (code 20)
rsync: write error: Broken pipe (32)

重新运行又从头开始,反复失败,永远无法完成。

原因分析

rsync 默认不保留部分传输的文件。一旦连接中断(SSH 超时、网络闪断),未完成的文件会丢失,下次同步需重新传输该文件。若大文件中断多次,或扫描阶段因小文件过多导致空闲超时,整个任务将陷入死循环。

根本原因:未启用断点续传

解决方案

同时优化 SSH 保活:

bash 复制代码
rsync -avz --delete --size-only \
      --partial --partial-dir=.rsync-partial \
      --bwlimit=30M \
      -e "ssh -p 19098 -o ServerAliveInterval=60 -o ServerAliveCountMax=3" \
      /src/ user@remote:/dest/

添加 --partial --partial-dir=.rsync-partial 参数。

  • --partial:保留已传输的文件片段,中断后下次可继续。
  • --partial-dir:指定临时目录存放碎片,避免与完整文件混淆。

其他参数说明:

参数 作用
--partial 保留部分传输的文件,实现断点续传
--partial-dir 指定碎片目录,避免残留
-o ServerAliveInterval=60 SSH 保活,防止空闲超时断开
--bwlimit 限速,避免占满业务带宽
--size-only 只比较大小,加快增量扫描

效果

中断后重新执行相同命令,rsync 自动从断点继续,不再从头开始。最终成功完成全部数据同步。

附脚本:

bash 复制代码
#!/bin/bash

# 配置参数 - 按需修改
REMOTE_IP="192.168.0.3"
SSH_PORT="22"
REMOTE_BASE="/remote-backup-dir"

# 待同步的本地源目录列表
SOURCE_DIRS=(
    "/minio/source-dir1"
    "/minio/source-dir2"
    "/minio/source-dir2"
)

# 循环执行 rsync 同步
echo "========== 开始批量目录同步 =========="
for src_dir in "${SOURCE_DIRS[@]}"; do
    # 提取目录名,拼接远端目标路径
    dir_name=$(basename "${src_dir}")
    dest_dir="${REMOTE_IP}:${REMOTE_BASE}/${dir_name}/"

    echo -e "\n正在同步: ${src_dir}/  -->  ${dest_dir}"
    rsync -avz --delete --size-only --partial --partial-dir=.rsync-partial  --bwlimit=30M  -e "ssh -p ${SSH_PORT}" "${src_dir}/" "${dest_dir}"

    # 判断同步结果
    if [ $? -eq 0 ]; then
        echo "✅ ${src_dir} 同步完成"
    else
        echo "❌ ${src_dir} 同步失败"
    fi
done

echo -e "\n========== 全部同步任务结束 =========="
相关推荐
我登哥MVP1 小时前
Spring Boot 从“会用”到“精通”:自定义参数绑定原理
java·spring boot·后端·spring·servlet·maven·intellij-idea
Pikachu8031 小时前
我在早高峰地铁里对手机吼了几句,隔壁同事直接看傻了
前端·后端
字节高级特工1 小时前
C++11(三)终极指南:可变参数模板与包装器详解
java·开发语言·c++·后端
constCpp2 小时前
深入理解内存管理
后端·中间件·架构
小番茄夫斯基2 小时前
全球大模型的价格和能力排行汇总
前端·后端·架构
用户298698530142 小时前
Java 实现 Word 文档内容复制:段落、章节与全文合并技巧
java·后端
ZengLiangYi2 小时前
从 RAG 到知识图谱:个人知识管理的演进
数据库·后端·程序员
小江的记录本2 小时前
【Spring全家桶】Spring AI核心原理、大模型集成、Prompt工程、RAG实现、AI Agent开发(附《思维导图》+《面试高频考点清单》)
java·人工智能·spring boot·后端·spring·面试·prompt
手握风云-2 小时前
Spring AI:让大模型住进 Spring 生态(五)
java·后端·spring