Stable Diffusion - 真人照片的高清修复 (StableSR + GFPGAN) 最佳实践

欢迎关注我的CSDN:https://spike.blog.csdn.net/

本文地址:https://spike.blog.csdn.net/article/details/132032216

GFPGAN (Generative Facial Prior GAN) 算法,用于实现真实世界的盲脸恢复的算法,利用预训练的面部 GAN(如 StyleGAN2 )中封装的丰富和多样的先验信息,来修复低质量、模糊、噪声或者损坏的人脸图像。GFPGAN 算法的主要贡献有以下几点:

  • 提出生成式面部先验(GFP),可以从预训练的面部 GAN 中提取高质量的面部特征,并通过空间特征变换层(SFT)将其融合到面部恢复过程中,从而提高了面部图像的真实性和保真度。
  • 设计通道分割空间特征变换层(CS-SFT),可以根据输入特征对GAN特征进行部分调制,从而在纹理的真实性和保真度之间达到一个良好的平衡。
  • 引入面部成分损失和身份保留损失,可以分别增强感知显著的面部成分(如眼睛、鼻子、嘴巴等)和保留面部的身份信息,从而提高了面部图像的视觉质量和语义一致性。

Paper: Towards Real-World Blind Face Restoration with Generative Facial Prior

有些模糊的真实图像,需要高清修复细节,同时,重点关注于人脸区域,保持人物属性不变。


1. 图像放大

图像放大4倍,扩充细节,可选 4x-UltraSharp 算法 (快速) 或 StableSR 算法 (高质量),参考 超分辨率插件 StableSR v2 (768x768) 配置与使用

1. Extra 4x-UltraSharp

SD Tab 选择 后期处理 (Extra), 放大算法使用 4x-UltraSharp ,图像放大 4倍,配置如下:

放大效果如下,重点观察脸部细节:

2. StableSR

StableSR算法的整体效果和细节,均优于4x-UltraSharp 算法,缺点是速度较慢。

使用 StableSR 放大算法脚本,同样放大 4 倍,启用 Tiled DiffusionTiled VAE,效果如下:

整体的对比效果,如下:


2. 脸部细节

修复完全身之后,再使用 后期处理 (Extra)GFPGAN 功能,修复脸部细节。

建议提前下载 GFPGAN 的 3 个模型,即 detection_Resnet50_Final.pthparsing_parsenet.pthGFPGANv1.4.pth

bash 复制代码
https://github.com/xinntao/facexlib/releases/download/v0.1.0/detection_Resnet50_Final.pth
# models/GFPGAN/detection_Resnet50_Final.pth

https://github.com/xinntao/facexlib/releases/download/v0.2.2/parsing_parsenet.pth
# models/GFPGAN/parsing_parsenet.pth

https://github.com/TencentARC/GFPGAN/releases/download/v1.3.0/GFPGANv1.4.pth
# models/GFPGAN/GFPGANv1.4.pth

cd models/GFPGAN/

wget https://ghproxy.com/https://github.com/xinntao/facexlib/releases/download/v0.1.0/detection_Resnet50_Final.pth
wget https://ghproxy.com/https://github.com/xinntao/facexlib/releases/download/v0.2.2/parsing_parsenet.pth
wget https://ghproxy.com/https://github.com/TencentARC/GFPGAN/releases/download/v1.3.0/GFPGANv1.4.pth

注意:GFPGAN 不会修改面部细节,只提供放大功能,而CodeFormer 则会修改面部细节。

GFPGAN 和 CodeFormer 的配置如下:

  • GFPGAN的可见程度设置为 1.0,更高权重。
  • CodeFormer可见程度设置为 0.2,权重设置为 0.8 (反向)

Extra 4x-UltraSharpGFPGAN 脸部修复,效果如下:

Stable SRExtra 4x-UltraSharpGFPGAN 脸部修复,明显Stable SR 优于 Extra 4x-UltraSharp,效果如下:

最终修复效果,即 StableSR + GFPGAN

参考:田曦薇的照片

相关推荐
老刘说AI1 天前
类Sora模型:解锁动态视觉艺术的密码
人工智能·stable diffusion·架构·embedding
python-码博士1 天前
Stable Diffusion 3 / FLUX 类模型中的 Flow Matching:怎么用、怎么调、怎么避坑
stable diffusion
Rocky Ding*4 天前
Latent Consistency Models:一篇读懂扩散模型的少步生成核心基础知识
人工智能·深度学习·机器学习·ai作画·stable diffusion·aigc·ai-native
Asimov_Liu5 天前
Diffusion 与 Flow Matching 数学原理及其在 VLA Action 生成中的应用
stable diffusion·自动驾驶·具身智能·vla·flow matching
Rocky Ding*5 天前
Token Merging for Fast Stable Diffusion:一篇读懂 Stable Diffusion 的免训练加速机制
论文阅读·人工智能·深度学习·机器学习·stable diffusion·aigc·ai-native
yuguo.im6 天前
Mac M4 安装 sd-webui 踩坑全记录
macos·stable diffusion
hugo_im7 天前
Mac M4 安装 sd-webui 踩坑全记录
stable diffusion
一叶知秋dong8 天前
Stable diffusion 工作原理
人工智能·深度学习·stable diffusion
仰望尾迹云11 天前
灵感画廊入门:AI绘画零基础到精通
stable diffusion·ai绘画·图像生成
AI极客菌11 天前
AI绘画工具中,为什么专业玩家爱用Stable Diffusion,普通玩家却喜欢Midjourney?
大数据·人工智能·ai·ai作画·stable diffusion·aigc·midjourney