BFG Repo-Cleaner 教程:快速清理 Git 仓库中的敏感数据和大文件

遇到Git仓库迁移因历史大文件导致推送失败?虽然删除了文件,但它们仍藏在Git历史中。本文教你使用BFG工具彻底清理历史大文件,成功完成迁移并优化仓库!

背景

最近接到一个需求,要把一个 Git 仓库的代码完整迁移到另一个仓库。听起来很简单,对吧?理想情况应该是:

arduino 复制代码
git clone 原仓库地址  
git remote set-url origin 新仓库地址  
git push -u origin main

Done!🎉

但现实情况往往没那么顺利...... 😅

当我 push 到新仓库时,报错了。服务器拒绝了提交,原因是这个仓库存在大文件。

问题出在哪?

其实当我们手动删除大文件只是从最新代码里移除了它们,但实际上,它们仍然藏在 Git 的历史记录里。只要有人仔细翻看 commit 历史,还是能找到被删掉的大文件(甚至是敏感数据)。

这就像:

📂 工作目录(最新代码)→ 干干净净

📜 Git 历史(隐藏记录)→ 仍然藏着之前的文件

为了解决这个问题, 就需要彻底清理 Git 历史中的大文件,让仓库瘦身,成功 push 到新服务器!

准备示例

下面我们在Gitee上新建一个远程仓库来完整重现这个问题的场景。

首先在Gitee 删新建一个远程仓库:

拉取远程仓库

接下来我们在目录下添加一个大文件视频,并提交本地仓库, 然后删除大文件。

此时推送代码时, 推送失败。原因是当前文件为284.988MB超过最大100M。

BFG 删除历史文件

在操作之前, 使用--mirror对仓库进行备份,拷贝一份新仓库

目前我们代码还没有提交所以我们使用本地路径克隆本地仓库

下载BFG Repo-Cleaner,BFG是一个jar文件, 要求Java8 或更高版本的 Java 运行环境

repo1.maven.org/maven2/com/...

将下载的jar 文件放在项目目录下, 使用--delete-filtes删除文件

删除大文件后即可提交成功

相关推荐
像风一样自由20207 小时前
HTML与JavaScript:构建动态交互式Web页面的基石
前端·javascript·html
wuk9988 小时前
基于MATLAB编制的锂离子电池伪二维模型
linux·windows·github
浪裡遊8 小时前
React Hooks全面解析:从基础到高级的实用指南
开发语言·前端·javascript·react.js·node.js·ecmascript·php
ai小鬼头9 小时前
AIStarter如何助力用户与创作者?Stable Diffusion一键管理教程!
后端·架构·github
天天扭码9 小时前
从图片到语音:我是如何用两大模型API打造沉浸式英语学习工具的
前端·人工智能·github
Liudef069 小时前
2048小游戏实现
javascript·css·css3
&Sinnt&11 小时前
Git 版本控制完全指南:从入门到精通
git·后端
独立开阀者_FwtCoder12 小时前
【Augment】 Augment技巧之 Rewrite Prompt(重写提示) 有神奇的魔法
前端·javascript·github
我想说一句12 小时前
事件机制与委托:从冒泡捕获到高效编程的奇妙之旅
前端·javascript
汤姆Tom12 小时前
JavaScript reduce()函数详解
javascript