Git 巨大失误案例记录 (2026-05-01)

Git 巨大失误案例记录 (2026-05-01)

事故概述

清理 Git 仓库大文件时,使用git filter-branch` 操作失误。


事故经过

第1步:发现问题

  • 远程仓库 大小超过 1024MB
  • 本地仓库大小:127.22 MiB
  • 最大文件:uite_Setup.exe (54.41 MB)

第2步:尝试清理

bash 复制代码
git verify-pack -v .git\objects\pack\*.idx
git rev-list --objects --all | sort -k 3 -n -r | head -20

第3步:使用 filter-branch 重写历史

bash 复制代码
git filter-branch --force --index-filter "git rm -r --cached --ignore-unmatch te_Setup.exe Out/ setup/ Plugins/" --prune-empty --tag-name-filter cat -- --all

第4步:删除备份引用(错误!)

bash 复制代码
git update-ref -d refs/original/refs/heads/master
git update-ref -d refs/original/refs/remotes/origin/master

第5步:执行 GC

bash 复制代码
git reflog expire --expire=now --all
git gc --prune=now --aggressive

第6步:尝试推送(失败)

bash 复制代码
git push -f origin master

失败原因:远程仓库还有旧的大对象未清理,超过 Gitee 1024MB 限制


清理前后对比

项目 清理前 清理后
Git 仓库大小 127.22 MiB 1.21 MiB
Git 对象数 974 498
最大文件 ite_Setup.exe (54.41 MB) g.doc (0.29 MB)
大文件已从历史中删除 setup/ (22个文件 已删除
Plugins/ (48个文件 已删除
Out/ (374个文件 已删除

⚠️ 教训总结

✅ 正确做法

  1. 先备份!

    bash 复制代码
    # 备份整个 .git 目录
    xcopy .git .git-backup /E /I /H /Y
  2. 使用 BFG Repo-Cleaner!

    bash 复制代码
    # 下载 BFG(比 filter-branch 更安全、更快
    java -jar bfg.jar --delete-files uite_Setup.exe
  3. 不要删除备份引用!

    • `refs/original/ 是 filter-branch 的安全网,后悔还可以恢复
  4. 远程仓库先 GC!

    • Gitee 上执行 GC 清理历史对象
    • 再强制推送

❌ 错误做法

  1. 不要直接删除 refs/original/
  2. 不要没有备份就操作
  3. 不要忽略远程仓库没清理就推送
  4. 不要用 git rm 不带 --cached(虽然这次带了,但用户担心)

教训文档

  • [v2-remaining-work-plan.md
  • [yeb-v2-code-review-plan.md
  • [code-review-report-plan.md
相关推荐
器灵科技1 分钟前
DeepSeek V4 Pro宣称:超GPT-5.5+永久降价75%
大数据·人工智能·gpt·阿里云·ai·语言模型
yyoc976 分钟前
本地 Flink on K8s + Iceberg + MinIO 实时数仓平台 — AI部署指南与踩坑实录
大数据·ai·flink·kubernetes·iceberg
戴国进11 分钟前
git stash 用法详解
git
阿坤带你走近大数据22 分钟前
flink的架构介绍
大数据·架构·flink
2501_9467862028 分钟前
2026算法分级分类备案TOP5解读——吃透差异化监管,规避过度合规风险
大数据
IPDEEP全球代理29 分钟前
TikTok为什么封号?应该怎么解决?(附IP环境解决方案)
大数据
专注于大数据技术栈1 小时前
什么是Trino?大数据统一联邦查询引擎详解
大数据·数据库
木雷双雄71 小时前
Git 版本回退操作指南
git
光锥智能1 小时前
赛豆:赛力斯的出路,火山引擎的标杆
大数据·人工智能·火山引擎
皮皮学姐分享-ppx10 小时前
政府绿色采购数据库(2015-2024.3)
大数据·网络·数据库·人工智能·制造