【BUG】删除git本地仓库/远程仓库历史版本中的大文件以减少仓库大小

目录

前言

  1. 某天像往常一样提交代码到gitee仓库,出现代码提交卡住不到的情况
    2. 我百思不得姐,坚信bug会自己修复自己的原则等待了5分钟,终于出现了如下提示
    原来是我的git提交的文件过大,触犯到了gitee的付费边缘。

排查过程

  1. 为什么会出现超过100M的大文件呢? 明明我连图片都没有几张,我这小项目也不可能有那么大的依赖
  2. 按照如下提示输入命令查询,是哪个小可爱(大文件)在阻止我上传
    3. 发现我居然之前的版本上传了jar包,还上传了几次!!!
    4. ok问题找到

解决过程

  1. 问题很明确: 历史提交的git版本有大文件存在,触发到了gitee免费权限的范围
  2. 所有需要整理git的历史版本记录,将本地的历史大文件全部去除
  3. 鉴于是我自己的项目,所有我直接把远程分支直接删除,把本地版本的大文件去除,再提交远程分支(多人项目当然不可取,此处为我自己项目就无所谓了)

通过如下命令查找历史大文件

在git bash Hear 中输入以下命令

java 复制代码
#  列出 10 个大文件
git rev-list --all | xargs -rL1 git ls-tree -r --long | sort -uk3 | sort -rnk4 | head -10

删除大文件,重构历史版本

java 复制代码
# 删除文件
git filter-branch -f --tree-filter "rm -f 要删除的文件路径(以当前目录为相对路径起点)" -- --all

提交

java 复制代码
git filter-branch -f --tree-filter "rm -f 要删除的文件路径" -- --all
# 推送
git push -f --all
# 重新检出克隆,查看文件是否已被删除
----------------------------------------------------------以下看需要操作
# 清理服务器文件、提交记录
# 以下命令在服务器 git 仓库储存目录下执行
# gitlab 默认所有仓库储存总文件夹 /var/opt/gitlab/git-data/repositories/@hashed,执行 gitlab-rake gitlab:backup:create 备份数据后,备份日志可以分析出具体项目储存的文件夹

# 标记所有引用中过期的记录,并将它们设为立即过期。引用包括分支(branch)、标签(tag)等。
git reflog expire --expire=now --all
# 通过垃圾回收(garbage collection)清理掉已经过期的引用以及与之关联的无效对象。--prune=now 表示立即清理过期的引用,--aggressive 则表示使用更激进的方式进行垃圾回收。
git gc --prune=now --aggressive

添加.ignore文件

复制代码
# Default ignored files
/shelf/
/workspace.xml
# Editor-based HTTP Client requests
/httpRequests/
# Datasource local storage ignored files
/dataSources/
/dataSources.local.xml

# Compiled class file
*.class

# Log file
*.log

# BlueJ files
*.ctxt

# Mobile Tools for Java (J2ME)
.mtj.tmp/

# Package Files #
*.jar
*.war
*.nar
*.ear
*.zip
*.tar.gz
*.rar
*.mvn

*.gitignore
# virtual machine crash logs, see http://www.java.com/en/download/help/error_hotspot.xml
hs_err_pid*


# IntelliJ
/out/
.idea/

### Maven template
/**/target/**
target/
pom.xml.tag
pom.xml.releaseBackup
pom.xml.versionsBackup
pom.xml.next
release.properties
dependency-reduced-pom.xml
buildNumber.properties
.mvn/timing.properties
**/.mvn/
## File-based project format:
*.iws
*.iml
*.ipr
/**/target/

总结

完结撒花------只是提供解决思路,更多需要需自己检索更好的方法

相关推荐
qcx231 小时前
【AI Engineering · Harness 系列】02 确定性外壳 × 非确定性内核——git push 红线的故事
人工智能·git·prompt·agent·engineering·harness
水云桐程序员1 小时前
10 分钟 Git 上手教程
git
Dontla2 小时前
Git三个主要区域介绍(工作区Working Directory、暂存区Index/Staging Area、仓库区Repository)
git
她说可以呀2 小时前
git在Ubuntu的下载和配置用户
git·ubuntu
隔窗听雨眠3 小时前
Git二分法精准定位Bug
git·bug·git bisect
喜欢流萤吖~3 小时前
分布式搜索引擎:Elasticsearch 从入门到实战
分布式·elasticsearch·搜索引擎
开开心心_Every4 小时前
安卓免费证件照制作软件,无广告弹窗
linux·运维·服务器·安全·elasticsearch·zookeeper·pdf
weixin_704266054 小时前
IDEA 整合 Git 并上传代码到 CSDN GitCode 超详细教程
git·intellij-idea·gitcode
芝士就是力量啊 ೄ೨5 小时前
Git使用教程(如何使用VSCode+Git+Gitee对项目进行版本控制)
git·vscode·gitee
OYangxf5 小时前
Git工作流用法
git