BFG Repo-Cleaner 教程:快速清理 Git 仓库中的敏感数据和大文件

遇到Git仓库迁移因历史大文件导致推送失败?虽然删除了文件,但它们仍藏在Git历史中。本文教你使用BFG工具彻底清理历史大文件,成功完成迁移并优化仓库!

背景

最近接到一个需求,要把一个 Git 仓库的代码完整迁移到另一个仓库。听起来很简单,对吧?理想情况应该是:

arduino 复制代码
git clone 原仓库地址  
git remote set-url origin 新仓库地址  
git push -u origin main

Done!🎉

但现实情况往往没那么顺利...... 😅

当我 push 到新仓库时,报错了。服务器拒绝了提交,原因是这个仓库存在大文件。

问题出在哪?

其实当我们手动删除大文件只是从最新代码里移除了它们,但实际上,它们仍然藏在 Git 的历史记录里。只要有人仔细翻看 commit 历史,还是能找到被删掉的大文件(甚至是敏感数据)。

这就像:

📂 工作目录(最新代码)→ 干干净净

📜 Git 历史(隐藏记录)→ 仍然藏着之前的文件

为了解决这个问题, 就需要彻底清理 Git 历史中的大文件,让仓库瘦身,成功 push 到新服务器!

准备示例

下面我们在Gitee上新建一个远程仓库来完整重现这个问题的场景。

首先在Gitee 删新建一个远程仓库:

拉取远程仓库

接下来我们在目录下添加一个大文件视频,并提交本地仓库, 然后删除大文件。

此时推送代码时, 推送失败。原因是当前文件为284.988MB超过最大100M。

BFG 删除历史文件

在操作之前, 使用--mirror对仓库进行备份,拷贝一份新仓库

目前我们代码还没有提交所以我们使用本地路径克隆本地仓库

下载BFG Repo-Cleaner,BFG是一个jar文件, 要求Java8 或更高版本的 Java 运行环境

repo1.maven.org/maven2/com/...

将下载的jar 文件放在项目目录下, 使用--delete-filtes删除文件

删除大文件后即可提交成功

相关推荐
程序员小寒几秒前
JavaScript设计模式(十):模板方法模式实现与应用
前端·javascript·设计模式·模板方法模式
We་ct4 分钟前
EventSource & WebSocket & HTTP
前端·javascript·网络·websocket·网络协议·http·面试
chQHk57BN12 分钟前
AI辅助编程:GitHub Copilot会取代开发者吗?
人工智能·github·copilot
小李子呢021110 小时前
前端八股性能优化(2)---回流(重排)和重绘
前端·javascript
吴声子夜歌11 小时前
Vue3——Vue实例与数据绑定
前端·javascript·vue.js
Smoothcloud润云13 小时前
从“预测下一个词”到“预测下一个世界状态”:世界模型作为AGI新范式的深度分析报告
人工智能·测试工具·微服务·容器·github·状态模式·agi
挖稀泥的工人14 小时前
AI聊天界面的布局细节和打字跟随方法
前端·javascript·面试
竹林81814 小时前
从“连接失败”到丝滑登录:我用 ethers.js 连接 MetaMask 的完整踩坑记录
前端·javascript
颜酱14 小时前
图片大模型实践:可灵(Kling)文生图前后端实现
前端·javascript·人工智能
Reart15 小时前
从0解构tinyWeb项目--(Day:2)
javascript·后端·架构