BFG Repo-Cleaner 教程:快速清理 Git 仓库中的敏感数据和大文件

遇到Git仓库迁移因历史大文件导致推送失败?虽然删除了文件,但它们仍藏在Git历史中。本文教你使用BFG工具彻底清理历史大文件,成功完成迁移并优化仓库!

背景

最近接到一个需求,要把一个 Git 仓库的代码完整迁移到另一个仓库。听起来很简单,对吧?理想情况应该是:

arduino 复制代码
git clone 原仓库地址  
git remote set-url origin 新仓库地址  
git push -u origin main

Done!🎉

但现实情况往往没那么顺利...... 😅

当我 push 到新仓库时,报错了。服务器拒绝了提交,原因是这个仓库存在大文件。

问题出在哪?

其实当我们手动删除大文件只是从最新代码里移除了它们,但实际上,它们仍然藏在 Git 的历史记录里。只要有人仔细翻看 commit 历史,还是能找到被删掉的大文件(甚至是敏感数据)。

这就像:

📂 工作目录(最新代码)→ 干干净净

📜 Git 历史(隐藏记录)→ 仍然藏着之前的文件

为了解决这个问题, 就需要彻底清理 Git 历史中的大文件,让仓库瘦身,成功 push 到新服务器!

准备示例

下面我们在Gitee上新建一个远程仓库来完整重现这个问题的场景。

首先在Gitee 删新建一个远程仓库:

拉取远程仓库

接下来我们在目录下添加一个大文件视频,并提交本地仓库, 然后删除大文件。

此时推送代码时, 推送失败。原因是当前文件为284.988MB超过最大100M。

BFG 删除历史文件

在操作之前, 使用--mirror对仓库进行备份,拷贝一份新仓库

目前我们代码还没有提交所以我们使用本地路径克隆本地仓库

下载BFG Repo-Cleaner,BFG是一个jar文件, 要求Java8 或更高版本的 Java 运行环境

repo1.maven.org/maven2/com/...

将下载的jar 文件放在项目目录下, 使用--delete-filtes删除文件

删除大文件后即可提交成功

相关推荐
OYangxf6 分钟前
Git Commit Message
运维·git
芯有所享26 分钟前
【芯片设计中的版本管理:Git与SVN的实战选择指南】
经验分享·git·svn
开发者联盟league34 分钟前
解决git报错 filename too long
git
jian110581 小时前
android studiod git在git reset origin/main以后,会有删了又新建的导包问题
git
白鲸开源1 小时前
杀疯了!SeaTunnel AI CLI 解锁数据集成新玩法
大数据·人工智能·github
AI_paid_community1 小时前
98.5k Star!GitHub官方开源的这个工具,正在把"vibe coding"扫进历史的垃圾桶
javascript·claude
AI_paid_community2 小时前
用 Claude Code 写了一年代码,装了这 18 个 Skills 之后,我才知道自己一直在"氛围编程"
javascript·面试
Skylwn2 小时前
保姆级教程之将 GitHub Models 接入 NewAPI
笔记·github
隔壁老王11112 小时前
浅谈JavaScript内存管理
javascript