FreeU: Free Lunch in Diffusion U-Net——【代码复现】

这篇文章发表于CVPR 2024,官网地址:ChenyangSi/FreeU: FreeU: Free Lunch in Diffusion U-Net (CVPR2024 Oral) (github.com)

一、环境准备

提前准备好python、pytorch环境

二、下载项目依赖

demo下有一个requirements.txt文件,

复制代码
pip install -r requirements.txt

三、运行

这个项目运行示例其实相对简单,这里直接跑它的gradio图形化界面就行:

复制代码
python demo/app.py

注:

1. 加载预训练模型:

这里我们要在app.py中把它默认的模型加载路径改成我们自己的,当然你也可以直接用默认的。前提是你的模型放在根目录下。

2.gradio版本

这个项目它需要使用gradio<=3.50.0的,不要超过3.50.0。

3.设置url

如果是在服务器上跑的代码,在我们本机这里是无法访问服务器的端口地址的,所以我们在app.py文件中,需要设置一下启动参数,我们需要将server_name改成服务器的ip地址,server_port是设置的端口号。然后再启动我们就可以在自己的电脑上用浏览器访问了。

4.diffusers版本

如果遇到这种类似的问题,看看你的diffusers版本是否和项目需求一致,这个diffusers包版本之间不兼容,真是特别让人头疼的地方。

四、图片生成

一切顺利的话,访问url,图形化界面如下:

这里我直接使用它的示例提示测试了一下,效果如下:

相关推荐
m0_678693331 小时前
深度学习笔记26-天气预测(Tensorflow)
笔记·深度学习·tensorflow
硅谷秋水1 小时前
NORA:一个用于具身任务的小型开源通才视觉-语言-动作模型
人工智能·深度学习·机器学习·计算机视觉·语言模型·机器人
xiaohanbao092 小时前
day54 python对抗生成网络
网络·python·深度学习·学习
scdifsn3 小时前
动手学深度学习13.3. 目标检测和边界框-笔记&练习(PyTorch)
笔记·深度学习·目标检测·目标识别·标注边界框
好喜欢吃红柚子3 小时前
【报错解决】RTX4090 nvrtc: error: invalid value for --gpu-architecture (-arch)
人工智能·python·深度学习·计算机视觉·visual studio
硬件学长森哥6 小时前
Android音视频多媒体开源框架基础大全
android·图像处理·音视频
HyperAI超神经7 小时前
在线教程丨刷新TTS模型SOTA,OpenAudio S1基于200万小时音频数据训练,深刻理解情感及语音细节
人工智能·深度学习·机器学习·文本转语音·语音处理·语音生成·在线教程
成都犀牛7 小时前
LlamaIndex 学习笔记
人工智能·python·深度学习·神经网络·学习
猛犸MAMMOTH7 小时前
Python打卡第53天
开发语言·python·深度学习
Grey Zeng7 小时前
《深度学习:基础与概念》第一章 学习笔记与思考
人工智能·深度学习·ai·读书笔记