【BUG】删除git本地仓库/远程仓库历史版本中的大文件以减少仓库大小

目录

前言

  1. 某天像往常一样提交代码到gitee仓库,出现代码提交卡住不到的情况
    2. 我百思不得姐,坚信bug会自己修复自己的原则等待了5分钟,终于出现了如下提示
    原来是我的git提交的文件过大,触犯到了gitee的付费边缘。

排查过程

  1. 为什么会出现超过100M的大文件呢? 明明我连图片都没有几张,我这小项目也不可能有那么大的依赖
  2. 按照如下提示输入命令查询,是哪个小可爱(大文件)在阻止我上传
    3. 发现我居然之前的版本上传了jar包,还上传了几次!!!
    4. ok问题找到

解决过程

  1. 问题很明确: 历史提交的git版本有大文件存在,触发到了gitee免费权限的范围
  2. 所有需要整理git的历史版本记录,将本地的历史大文件全部去除
  3. 鉴于是我自己的项目,所有我直接把远程分支直接删除,把本地版本的大文件去除,再提交远程分支(多人项目当然不可取,此处为我自己项目就无所谓了)

通过如下命令查找历史大文件

在git bash Hear 中输入以下命令

java 复制代码
#  列出 10 个大文件
git rev-list --all | xargs -rL1 git ls-tree -r --long | sort -uk3 | sort -rnk4 | head -10

删除大文件,重构历史版本

java 复制代码
# 删除文件
git filter-branch -f --tree-filter "rm -f 要删除的文件路径(以当前目录为相对路径起点)" -- --all

提交

java 复制代码
git filter-branch -f --tree-filter "rm -f 要删除的文件路径" -- --all
# 推送
git push -f --all
# 重新检出克隆,查看文件是否已被删除
----------------------------------------------------------以下看需要操作
# 清理服务器文件、提交记录
# 以下命令在服务器 git 仓库储存目录下执行
# gitlab 默认所有仓库储存总文件夹 /var/opt/gitlab/git-data/repositories/@hashed,执行 gitlab-rake gitlab:backup:create 备份数据后,备份日志可以分析出具体项目储存的文件夹

# 标记所有引用中过期的记录,并将它们设为立即过期。引用包括分支(branch)、标签(tag)等。
git reflog expire --expire=now --all
# 通过垃圾回收(garbage collection)清理掉已经过期的引用以及与之关联的无效对象。--prune=now 表示立即清理过期的引用,--aggressive 则表示使用更激进的方式进行垃圾回收。
git gc --prune=now --aggressive

添加.ignore文件

# Default ignored files
/shelf/
/workspace.xml
# Editor-based HTTP Client requests
/httpRequests/
# Datasource local storage ignored files
/dataSources/
/dataSources.local.xml

# Compiled class file
*.class

# Log file
*.log

# BlueJ files
*.ctxt

# Mobile Tools for Java (J2ME)
.mtj.tmp/

# Package Files #
*.jar
*.war
*.nar
*.ear
*.zip
*.tar.gz
*.rar
*.mvn

*.gitignore
# virtual machine crash logs, see http://www.java.com/en/download/help/error_hotspot.xml
hs_err_pid*


# IntelliJ
/out/
.idea/

### Maven template
/**/target/**
target/
pom.xml.tag
pom.xml.releaseBackup
pom.xml.versionsBackup
pom.xml.next
release.properties
dependency-reduced-pom.xml
buildNumber.properties
.mvn/timing.properties
**/.mvn/
## File-based project format:
*.iws
*.iml
*.ipr
/**/target/

总结

完结撒花------只是提供解决思路,更多需要需自己检索更好的方法

相关推荐
LI JS@你猜啊43 分钟前
Elasticsearch 集群
大数据·服务器·elasticsearch
木心1 小时前
Git基本操作快速入门(30min)
git·github
LXL_242 小时前
Git_撤销本地commit_查找仓库中大文件
git
yg_小小程序员3 小时前
鸿蒙开发(16)使用DevEco Studio上的Git工具进行多远程仓管理
git·华为·harmonyos
神奇侠20245 小时前
解决集群Elasticsearch 未授权访问漏洞
elasticsearch
Elastic 中国社区官方博客5 小时前
如何通过 Kafka 将数据导入 Elasticsearch
大数据·数据库·分布式·elasticsearch·搜索引擎·kafka·全文检索
神奇侠20245 小时前
解决单台Elasticsearch 未授权访问漏洞
elasticsearch
nece0015 小时前
elasticsearch 杂记
大数据·elasticsearch·搜索引擎
开心最重要(*^▽^*)5 小时前
Es搭建——单节点——Linux
大数据·elasticsearch