BFG Repo-Cleaner 教程:快速清理 Git 仓库中的敏感数据和大文件

遇到Git仓库迁移因历史大文件导致推送失败?虽然删除了文件,但它们仍藏在Git历史中。本文教你使用BFG工具彻底清理历史大文件,成功完成迁移并优化仓库!

背景

最近接到一个需求,要把一个 Git 仓库的代码完整迁移到另一个仓库。听起来很简单,对吧?理想情况应该是:

arduino 复制代码
git clone 原仓库地址  
git remote set-url origin 新仓库地址  
git push -u origin main

Done!🎉

但现实情况往往没那么顺利...... 😅

当我 push 到新仓库时,报错了。服务器拒绝了提交,原因是这个仓库存在大文件。

问题出在哪?

其实当我们手动删除大文件只是从最新代码里移除了它们,但实际上,它们仍然藏在 Git 的历史记录里。只要有人仔细翻看 commit 历史,还是能找到被删掉的大文件(甚至是敏感数据)。

这就像:

📂 工作目录(最新代码)→ 干干净净

📜 Git 历史(隐藏记录)→ 仍然藏着之前的文件

为了解决这个问题, 就需要彻底清理 Git 历史中的大文件,让仓库瘦身,成功 push 到新服务器!

准备示例

下面我们在Gitee上新建一个远程仓库来完整重现这个问题的场景。

首先在Gitee 删新建一个远程仓库:

拉取远程仓库

接下来我们在目录下添加一个大文件视频,并提交本地仓库, 然后删除大文件。

此时推送代码时, 推送失败。原因是当前文件为284.988MB超过最大100M。

BFG 删除历史文件

在操作之前, 使用--mirror对仓库进行备份,拷贝一份新仓库

目前我们代码还没有提交所以我们使用本地路径克隆本地仓库

下载BFG Repo-Cleaner,BFG是一个jar文件, 要求Java8 或更高版本的 Java 运行环境

repo1.maven.org/maven2/com/...

将下载的jar 文件放在项目目录下, 使用--delete-filtes删除文件

删除大文件后即可提交成功

相关推荐
shuaijie051817 分钟前
当表格数据量过大的时候,如何使用不分页进行展示
javascript·vue.js·ecmascript
大柏怎么被偷了36 分钟前
【Git】企业级开发模型
git
How_doyou_do1 小时前
常见的设计模式
前端·javascript·设计模式
Garfield20051 小时前
Git 分支拓扑实践
git·拓扑
DKNG1 小时前
【Windows Host】 hosts配置增加访问github流畅度
人工智能·git·github
Gomiko1 小时前
JavaScript DOM 原生部分(五):事件绑定
开发语言·前端·javascript
巴拉巴拉~~1 小时前
Flutter 通用下拉选择组件 CommonDropdown:单选 + 搜索 + 自定义样式
开发语言·javascript·ecmascript
逛逛GitHub2 小时前
我把公众号文章导入了腾讯 ima,可以对话找开源项目了。
前端·github
Можно2 小时前
深入理解 JavaScript 函数:分类、特性与实战应用
开发语言·javascript
lionliu05192 小时前
JavaScript 变量声明最佳实践
前端·javascript·vue.js