一个令人惊艳的图片高清化重绘神器:SUPIR来了!

本文给大家分享一个将模糊图片还原为照片级高清图像的AI项目:SUPIR。这个项目以尖端的大规模人工智能革新图像恢复技术,通过文本驱动、智能修复,将AI技术与创新思维相结合,赋予每张图像全新的生命力。这个项目的修复能力本质上是一种重绘能力,很多搞设计的同学都说挺不错。

效果展示

经过我的实测,这个项目特别适合低分辨率和模糊照片的高清化处理,比Stable Diffusion WebUI中的高清化效果要好上很多。话不多说,先看效果:

风景图片

感觉这个项目对风景图和物件等真实场景照片的高清化修复效果是最好的,默认设置就可以出来比较好的效果。

人物肖像

人物肖像的处理效果稍微差点,不过相比其它的AI项目还是会好上不少的。这里我从网上找了一些模糊的剧照和普通人照片,大家可以参考下。小图看着不是很明显,放大对比效果比较明显,建议实际试试。相关图片可以到我的公众号(yinghuo6ai)领取。

老照片

这个项目也可以修复老照片,不过略感遗憾的是,这个项目没有修复破损图片的能力,和之前分享过的老照片高清修复对比一下:可以看到图片上的斑点、划线都被加强了。那种有很多雪花、污渍和裂痕的图片并不适合用SUPIR进行直接修复,可以试试一些AI在线修复工具,比如改图鸭、VanceAI等。

不过SUPIR的优点也很明显,不仅处理了面部,对画面中的其它元素也进行了修复,比如上图中的服装部分更清晰了。所以这又给我提供了一个新的思路,先通过之前SD WebUI的方法对图片进行高清处理,再通过SUPIR进一步处理,我们仍然能获得一些收益。效果对比如下:

部署安装

这个项目发布在Github上:github.com/Fanghua-Yu/...

你可以参照其中的介绍自行安装,不过坑可能比较多,还有很多模型需要特殊网络设置才能下载,仅建议技术高手尝试。

为了方便使用,我在AutoDL的云环境中制作了一个镜像,可以一键启动,直接开始创作,免去安装和下载模型的烦恼,创建实例时搜索社区镜像 yinghuoai-SUPIR 即可找到。

另外我对自己的安装过程也做了一个整理,相关程序和模型都提供了方便的下载地址,按照这个步骤你可以把它部署在任意地方。

制作不易,镜像使用方法和独立安装说明目前仅发布在我的AI绘画专栏,如有需要点此前往

使用方法

基本使用

SUPIR使用起来很简单,只需要4步,如下图所示:

第1步:上传一张待处理的照片,这里以百度贴吧中"弱智吧"的Logo为例。

第2步:对图片进行预处理。这一步会对图片进行"伽玛校正",校正图片的亮度和色彩。预处理的图片会展示在 Stage1 Output 处。

第3步:生成图片内容描述。这是下一步用来修复图片的提示词,生成后展示在 Prompt 处,如果感觉描述不准确,可以手动修改。

第4步:提交修复图片。这一步可能比较慢,最终效果会展示在 Upscaled Images Output 处。可以拖动中间的横线,对比原始图片和修复图片的差别。

调整参数

如果你对修复的效果不是很满意,可以调整参数试试。我在修复人像图片的时候就遇到一些问题,皮肤皱纹会比较多,显得很老,或者模型根本没有理解图片中各个部分的内容,图片崩掉了。

我们先看一下阶段1和阶段2的这几个参数,如下图所示:

基本上就是Stable Diffusion的相关参数,参数的含义我已经在图中做了标记,就不挨个介绍了,只挑几个重点的参数说明下。

4、图像放大倍数:图像越大使用的显存越多,处理的也越慢。

6、提示词引导系数:如果感觉生成的图片偏离原图过多,可以降低这个数值试试。模糊图像比较明显。

7、阶段2引导强度:如果感觉生成的图片偏离原图过多,也可以同时降低这个数值试试。模糊图像比较明显。

11、引入噪音:会在每次采样时加入一些噪音,值越大生成图片的变化会更多一些。

12、正向提示词:你想加强哪些方面,就写上对应的词语。

13、负向提示词:你不想要哪些方面,就把对应的词语写在这里。比如ugly,bad face等等。

另外还有一些参数,对图片的处理影响比较小,这里简单介绍下,如下图所示:

1、侧重质量还是还原性:图片质量高可能与原图差别较大,还原性就是保真性,更贴近原图。

3、线性阶段2引导起始阶段:这个参数会让图片更贴近提示词,产生更多变化。如果使用,建议使用0.75以上,不要偏离的太多。


以上就是本文的主要内容,有兴趣的快去试试吧!

相关推荐
开始学AI3 分钟前
ChatClimate:让对话式人工智能立足于气候科学
人工智能
学习路上_write16 分钟前
神经网络初次学习收获
人工智能·python
zstar-_17 分钟前
DeepSeek-OCR可能成为开启新时代的钥匙
人工智能·ocr
墨利昂29 分钟前
自然语言处理NLP的数据预处理:从原始文本到模型输入(MindSpore版)
人工智能·自然语言处理
win4r31 分钟前
🚀DeepSeek又放大招!这个OCR模型让文档识别效率倍增!本地部署+客观实测DeepSeek-OCR!OCR识别准确率97%,支持100+语言,每天处理3
llm·aigc·deepseek
wb0430720135 分钟前
如何开发一个 IDEA 插件通过 Ollama 调用大模型为方法生成仙侠风格的注释
人工智能·语言模型·kotlin·intellij-idea
apocalypsx36 分钟前
深度学习-卷积神经网络基础
人工智能·深度学习·cnn
王中阳Go43 分钟前
挑战一周用 AI 开发商业化项目!4 大痛点反思 + 新手专属提示词分享
后端·aigc·openai
Aevget1 小时前
界面控件DevExpress WPF v25.2新功能预览 - 聚焦AI功能提升
人工智能·wpf·界面控件·devexpress·ui开发·.net 10
F_D_Z1 小时前
扩散模型对齐:DMPO 让模型更懂人类偏好
人工智能·扩散模型·kl散度·双阶段训练·散度最小化偏好优化