[超分辨率重建]ESRGAN算法训练自己的数据集过程

一、下载数据集及项目包

1. 数据集

1.1 文件夹框架的介绍,如下图所示:主要有train和val,分别有高清(HR)和低清(LR)的图像。
1.2 原图先通过分割尺寸的脚本先将数据集图片处理成两个相同的图像组(HR和LR)。

如训练x4的ESRGAN模型,那么我们需要将HR的图像尺寸与LR的图像尺寸比例是4:1。在我的训练中,我将HR的图像尺寸分割成了480x480,LR的图像分割成了120x120。如下图所示。

随后将分割好的图像按照train和val的分类,分成如1.1图中的文件结构。

2. 项目包

在我的下载资源中有SR项目包的下载,后续上链接。也可以在我上传的资源中下载。

二、训练ESRGAN

ESRGAN模型包括生成模型的训练和判别模型的训练。

2.1 配置RRDBNet_train.py(生成模型)的参数及训练

2.1.1 训练的图像路径设置:dataroot_gt为HR图像的路径、dataroot_lq为LR图像的路径。
2.1.2 batch_size_per_gpu为batchsize的设置,根据显存大小相应设置,显存越大可以设置的值越大,但是训练时间也会增大。
2.1.3 val的数据集路径设置,dataroot_gt为HR的图像路径、dataroot_lq为LR图像的路径。
2.1.4 训练迭代次数的设置,可以设置到10万或者更大
2.1.5 训练结果指标的计算psnr和ssim。val_freq参数为保存结果的频率。下图中我的设置为1e3即1000轮保存一次。
2.1.6 保存训练权重的频率设置。下图中我的设置为1e3,即为1000次保存一次训练权重。
2.1.7 RRDBNet_train.py的训练
python 复制代码
python basicsr/train.py -opt options\train\ESRGAN\train_RRDBNet_PSNR_x4.yml

2.2 配置ESRGAN_train.py(判别模型)的参数及训练

2.2.1 ESRGAN_train.py的参数设置

ESRGAN_train.py的参数设置与RRDBNet_train.py相同,但是多了一个pretrain_network_g参数的设置,即填RRDBNet_train.py训练完以后最好的那次权重路径。

2.2.2 ESRGAN_train.py的训练
python 复制代码
python basicsr/train.py -opt options\train\ESRGAN\train_RRDBNet_PSNR_x4.yml

三、测试

3.1 测试图片路径的设置

包括HR和LR的路径,分别为dataroot_gt和dataroot_lq。

3.2 ESRGAN模型权重的路径导入

在pretrain_network_g参数中导入ESRGAN模型训练完后生成的权重路径。

四、训练中断后,继续训练

只需要在训练代码后加上--auto_resume

python 复制代码
python basicsr/train.py -opt options\train\ESRGAN\train_RRDBNet_PSNR_x4.yml --auto_resume

------------------ 今天不学习,明天变垃圾。 ---------------------

相关推荐
元岳数字人小元4 小时前
AI 数字人开发公司浅谈 虚拟数字人打造景区新服务
人工智能·人机交互·交互
哦哦~9214 小时前
AI赋能生物医学:从临床数据到药物分子性质预测实战培
人工智能·生物医学·药物分子
GIS数据转换器4 小时前
城市排水生命线安全运行监测平台深度解析
java·运维·人工智能·python·安全·数据挖掘·无人机
虫无涯4 小时前
本地离线大模型实战:Ollama + Llama 3.1 8B 全流程部署(适配VSCode Continue代码助手)
人工智能
Rocky Ding*4 小时前
Latent Consistency Models:一篇读懂扩散模型的少步生成核心基础知识
人工智能·深度学习·机器学习·ai作画·stable diffusion·aigc·ai-native
大山佬4 小时前
AI 边缘部署:MCU 上的轻量级目标检测,从 YOLO 到 TFLite Micro 的全链路优化
人工智能
数睿数据无代码开发4 小时前
深度解析smardaten数据大屏:六大核心功能重塑可视化开发
人工智能·信息可视化
陈猪的杰咪4 小时前
GitHub Copilot 2026计费新规:AI Credits消耗解析与节省策略
人工智能·ai·架构·github·copilot
学术头条5 小时前
清华团队开源SCAIL-2:角色动画告别骨骼依赖,端到端还原视频中动作细节
人工智能·科技·机器学习·ai·开源·音视频·agi
لا معنى له5 小时前
世界模型的功能分类法——Renderers, Simulators, Planners, and the Loop That Connects Them
人工智能