【BUG】删除git本地仓库/远程仓库历史版本中的大文件以减少仓库大小

目录

前言

  1. 某天像往常一样提交代码到gitee仓库,出现代码提交卡住不到的情况
    2. 我百思不得姐,坚信bug会自己修复自己的原则等待了5分钟,终于出现了如下提示
    原来是我的git提交的文件过大,触犯到了gitee的付费边缘。

排查过程

  1. 为什么会出现超过100M的大文件呢? 明明我连图片都没有几张,我这小项目也不可能有那么大的依赖
  2. 按照如下提示输入命令查询,是哪个小可爱(大文件)在阻止我上传
    3. 发现我居然之前的版本上传了jar包,还上传了几次!!!
    4. ok问题找到

解决过程

  1. 问题很明确: 历史提交的git版本有大文件存在,触发到了gitee免费权限的范围
  2. 所有需要整理git的历史版本记录,将本地的历史大文件全部去除
  3. 鉴于是我自己的项目,所有我直接把远程分支直接删除,把本地版本的大文件去除,再提交远程分支(多人项目当然不可取,此处为我自己项目就无所谓了)

通过如下命令查找历史大文件

在git bash Hear 中输入以下命令

java 复制代码
#  列出 10 个大文件
git rev-list --all | xargs -rL1 git ls-tree -r --long | sort -uk3 | sort -rnk4 | head -10

删除大文件,重构历史版本

java 复制代码
# 删除文件
git filter-branch -f --tree-filter "rm -f 要删除的文件路径(以当前目录为相对路径起点)" -- --all

提交

java 复制代码
git filter-branch -f --tree-filter "rm -f 要删除的文件路径" -- --all
# 推送
git push -f --all
# 重新检出克隆,查看文件是否已被删除
----------------------------------------------------------以下看需要操作
# 清理服务器文件、提交记录
# 以下命令在服务器 git 仓库储存目录下执行
# gitlab 默认所有仓库储存总文件夹 /var/opt/gitlab/git-data/repositories/@hashed,执行 gitlab-rake gitlab:backup:create 备份数据后,备份日志可以分析出具体项目储存的文件夹

# 标记所有引用中过期的记录,并将它们设为立即过期。引用包括分支(branch)、标签(tag)等。
git reflog expire --expire=now --all
# 通过垃圾回收(garbage collection)清理掉已经过期的引用以及与之关联的无效对象。--prune=now 表示立即清理过期的引用,--aggressive 则表示使用更激进的方式进行垃圾回收。
git gc --prune=now --aggressive

添加.ignore文件

复制代码
# Default ignored files
/shelf/
/workspace.xml
# Editor-based HTTP Client requests
/httpRequests/
# Datasource local storage ignored files
/dataSources/
/dataSources.local.xml

# Compiled class file
*.class

# Log file
*.log

# BlueJ files
*.ctxt

# Mobile Tools for Java (J2ME)
.mtj.tmp/

# Package Files #
*.jar
*.war
*.nar
*.ear
*.zip
*.tar.gz
*.rar
*.mvn

*.gitignore
# virtual machine crash logs, see http://www.java.com/en/download/help/error_hotspot.xml
hs_err_pid*


# IntelliJ
/out/
.idea/

### Maven template
/**/target/**
target/
pom.xml.tag
pom.xml.releaseBackup
pom.xml.versionsBackup
pom.xml.next
release.properties
dependency-reduced-pom.xml
buildNumber.properties
.mvn/timing.properties
**/.mvn/
## File-based project format:
*.iws
*.iml
*.ipr
/**/target/

总结

完结撒花------只是提供解决思路,更多需要需自己检索更好的方法

相关推荐
恋喵大鲤鱼2 小时前
git checkout
git·git checkout
知识汲取者4 小时前
Git撤销操作全解析:revert、undo与drop commit的区别与应用
git
AI周红伟6 小时前
agent-skills 一键落地实操指南-运行指南-周红伟
大数据·人工智能·elasticsearch·搜索引擎
鬼才血脉6 小时前
Idea使用Tomact运行项目,控制台输出中文乱码
tomcat·bug
做个文艺程序员8 小时前
第10篇(终篇):生产级 ES 运维——监控、备份、安全与故障排查完全手册
运维·安全·elasticsearch·es备份恢复·es升级·集群故障排查
清水白石0089 小时前
构建企业级 Python 服务:配置、日志、指标与追踪的稳健之道
开发语言·python·elasticsearch
cxxx179 小时前
【同步Overleaf, Github】
git·overleaf
染翰10 小时前
Linux root用户安装配置Git
linux·git·后端
老虎海子11 小时前
从零手搓一个 AI 编程助手:Mini Claude Code 完全指南
人工智能·git·vscode·python·github
Cat_Rocky11 小时前
CICD-Git简单学习 操作流程后续补
git·学习