【BUG】删除git本地仓库/远程仓库历史版本中的大文件以减少仓库大小

目录

前言

  1. 某天像往常一样提交代码到gitee仓库,出现代码提交卡住不到的情况
    2. 我百思不得姐,坚信bug会自己修复自己的原则等待了5分钟,终于出现了如下提示
    原来是我的git提交的文件过大,触犯到了gitee的付费边缘。

排查过程

  1. 为什么会出现超过100M的大文件呢? 明明我连图片都没有几张,我这小项目也不可能有那么大的依赖
  2. 按照如下提示输入命令查询,是哪个小可爱(大文件)在阻止我上传
    3. 发现我居然之前的版本上传了jar包,还上传了几次!!!
    4. ok问题找到

解决过程

  1. 问题很明确: 历史提交的git版本有大文件存在,触发到了gitee免费权限的范围
  2. 所有需要整理git的历史版本记录,将本地的历史大文件全部去除
  3. 鉴于是我自己的项目,所有我直接把远程分支直接删除,把本地版本的大文件去除,再提交远程分支(多人项目当然不可取,此处为我自己项目就无所谓了)

通过如下命令查找历史大文件

在git bash Hear 中输入以下命令

java 复制代码
#  列出 10 个大文件
git rev-list --all | xargs -rL1 git ls-tree -r --long | sort -uk3 | sort -rnk4 | head -10

删除大文件,重构历史版本

java 复制代码
# 删除文件
git filter-branch -f --tree-filter "rm -f 要删除的文件路径(以当前目录为相对路径起点)" -- --all

提交

java 复制代码
git filter-branch -f --tree-filter "rm -f 要删除的文件路径" -- --all
# 推送
git push -f --all
# 重新检出克隆,查看文件是否已被删除
----------------------------------------------------------以下看需要操作
# 清理服务器文件、提交记录
# 以下命令在服务器 git 仓库储存目录下执行
# gitlab 默认所有仓库储存总文件夹 /var/opt/gitlab/git-data/repositories/@hashed,执行 gitlab-rake gitlab:backup:create 备份数据后,备份日志可以分析出具体项目储存的文件夹

# 标记所有引用中过期的记录,并将它们设为立即过期。引用包括分支(branch)、标签(tag)等。
git reflog expire --expire=now --all
# 通过垃圾回收(garbage collection)清理掉已经过期的引用以及与之关联的无效对象。--prune=now 表示立即清理过期的引用,--aggressive 则表示使用更激进的方式进行垃圾回收。
git gc --prune=now --aggressive

添加.ignore文件

# Default ignored files
/shelf/
/workspace.xml
# Editor-based HTTP Client requests
/httpRequests/
# Datasource local storage ignored files
/dataSources/
/dataSources.local.xml

# Compiled class file
*.class

# Log file
*.log

# BlueJ files
*.ctxt

# Mobile Tools for Java (J2ME)
.mtj.tmp/

# Package Files #
*.jar
*.war
*.nar
*.ear
*.zip
*.tar.gz
*.rar
*.mvn

*.gitignore
# virtual machine crash logs, see http://www.java.com/en/download/help/error_hotspot.xml
hs_err_pid*


# IntelliJ
/out/
.idea/

### Maven template
/**/target/**
target/
pom.xml.tag
pom.xml.releaseBackup
pom.xml.versionsBackup
pom.xml.next
release.properties
dependency-reduced-pom.xml
buildNumber.properties
.mvn/timing.properties
**/.mvn/
## File-based project format:
*.iws
*.iml
*.ipr
/**/target/

总结

完结撒花------只是提供解决思路,更多需要需自己检索更好的方法

相关推荐
Smile丶凉轩21 分钟前
微服务即时通讯系统的实现(服务端)----(1)
c++·git·微服务·github
jwolf21 小时前
Elasticsearch向量搜索:从语义搜索到图搜图只有一步之遥
elasticsearch·搜索引擎·ai
你可以叫我仔哥呀2 小时前
ElasticSearch学习笔记三:基础操作(一)
笔记·学习·elasticsearch
hummhumm3 小时前
第 25 章 - Golang 项目结构
java·开发语言·前端·后端·python·elasticsearch·golang
爱写代码的派大星6 小时前
bug 就像隐藏在暗处的小怪兽
bug
燕双嘤6 小时前
Bug:引入Feign后触发了2次、4次ContextRefreshedEvent
bug
java1234_小锋6 小时前
Elasticsearch中的节点(比如共20个),其中的10个选了一个master,另外10个选了另一个master,怎么办?
大数据·elasticsearch·jenkins
Elastic 中国社区官方博客6 小时前
Elasticsearch 开放推理 API 增加了对 IBM watsonx.ai Slate 嵌入模型的支持
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
我的运维人生6 小时前
Elasticsearch实战应用:构建高效搜索与分析平台
大数据·elasticsearch·jenkins·运维开发·技术共享
和你一起去月球10 小时前
TypeScript - 函数(下)
javascript·git·typescript