GIT历史存在大文件的解决办法

问题触发

在今天迁移项目的时候,触发了一个报错无法推送 refs 到远端。您可以试着运行"拉取"功能,整合您的更改。看了看报错日志发现问题在这里:remote: Find the desired index: b4fc9cd2860327f09ae017bb50ecdadc9fc7d76a, size: 134.975MB, exceeds quota 100MB

可以看出是因为历史大文件导致的无法成功推送。

问题解决

1.找到这个大文件是什么

首先我们使用如下命令去找到这个大文件是什么:

cmd 复制代码
git rev-list --objects --all | git cat-file --batch-check='%(objecttype) %(objectname) %(objectsize) %(rest)' | awk '/^blob/ {if ($3 > 100000000) print substr($0,53)}'

一般会返回如下的值

415 XXX.jar

在这个数据里面 415代表的是大小 415M, 后面就是代表着他的文件名称。

2.在历史中删除该文件

现在考虑使用git filter-repo工具

2.1.安装 filter-repo

安装git-filter-repo(如果尚未安装):

bash 复制代码
pip install git-filter-repo

2.2 根据大小删除文件

这个是根据大小来删除文件的办法 可以删除 100M以上的文件

bash 复制代码
git filter-repo --strip-blobs-bigger-than 100M

3.清理本地仓库

这一步是为了防止有缓存等影响之后的数据:

ini 复制代码
git reflog expire --expire=now --all
git gc --prune=now --aggressive
git count-objects -vH  # 检查仓库大小

4.强制推送清理后的历史

css 复制代码
git push origin master --force

结束

补充说明

如果上述没有办法解决, 也可以试试 备选方案:手动创建新仓库。

相关推荐
葫芦和十三15 小时前
图解 MongoDB 02|BSON:你以为存的是 JSON,其实是带类型的二进制
后端·mongodb·agent
葫芦和十三15 小时前
图解 MongoDB 01|文档数据库
后端·mongodb·agent
runnerdancer17 小时前
LLM是怎么处理messages数组的,提示词缓存又是什么
前端·agent
陈随易18 小时前
VSCode的Copilot扩展支持接入DeepSeek,Kimi了!
前端·后端·程序员
我不是外星人19 小时前
有了 Harness Engineering ,真的还需要研发工程师吗?
前端·后端·ai编程
candyTong19 小时前
RTK 技术原理:一次典型会话里,80% 上下文是怎么省下来的
javascript·后端·架构
Rust研习社21 小时前
组合真的优于继承吗?为什么 Rust 和 Go 都拥抱组合舍弃继承?
后端·rust·编程语言
IT_陈寒1 天前
JavaScript的闭包把我坑惨了,说好的内存会自动回收呢?
前端·人工智能·后端
CaffeinePro1 天前
Pydantic深度使用:数据校验、枚举、ORM映射
后端·fastapi
Jackson__1 天前
分享一个横向滚动案例,带悬停暂停,通用性很强
前端