FreeU: Free Lunch in Diffusion U-Net——【代码复现】

这篇文章发表于CVPR 2024,官网地址:ChenyangSi/FreeU: FreeU: Free Lunch in Diffusion U-Net (CVPR2024 Oral) (github.com)

一、环境准备

提前准备好python、pytorch环境

二、下载项目依赖

demo下有一个requirements.txt文件,

复制代码
pip install -r requirements.txt

三、运行

这个项目运行示例其实相对简单,这里直接跑它的gradio图形化界面就行:

复制代码
python demo/app.py

注:

1. 加载预训练模型:

这里我们要在app.py中把它默认的模型加载路径改成我们自己的,当然你也可以直接用默认的。前提是你的模型放在根目录下。

2.gradio版本

这个项目它需要使用gradio<=3.50.0的,不要超过3.50.0。

3.设置url

如果是在服务器上跑的代码,在我们本机这里是无法访问服务器的端口地址的,所以我们在app.py文件中,需要设置一下启动参数,我们需要将server_name改成服务器的ip地址,server_port是设置的端口号。然后再启动我们就可以在自己的电脑上用浏览器访问了。

4.diffusers版本

如果遇到这种类似的问题,看看你的diffusers版本是否和项目需求一致,这个diffusers包版本之间不兼容,真是特别让人头疼的地方。

四、图片生成

一切顺利的话,访问url,图形化界面如下:

这里我直接使用它的示例提示测试了一下,效果如下:

相关推荐
罗西的思考5 小时前
【Agent】MemOS 源码笔记---(5)---记忆分类
人工智能·深度学习·算法
深度学习实战训练营6 小时前
U-Net++:嵌套密集跳跃连接,多尺度融合增强特征表达,医学影像分割的unet创新-k学长深度学习专栏
人工智能·深度学习
哥布林学者6 小时前
吴恩达深度学习课程四:计算机视觉 第二周:经典网络结构 (一)经典卷积网络
深度学习·ai
Coding茶水间6 小时前
基于深度学习的反光衣检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)
图像处理·人工智能·深度学习·yolo·目标检测·机器学习·计算机视觉
IT·小灰灰7 小时前
告别“翻墙“烦恼:DMXAPI让Gemini-3-pro-thinking调用快如闪电
网络·人工智能·python·深度学习·云计算
DatGuy8 小时前
Week 29: 深度学习补遗:MoE的稳定性机制与路由策略实现
人工智能·深度学习
一瞬祈望10 小时前
PyTorch 图像分类完整项目模板实战
人工智能·pytorch·python·深度学习·分类
Master_oid10 小时前
机器学习25:了解领域自适应(Domain Adaptation)
人工智能·深度学习·机器学习
永恒-龙啸10 小时前
图像增强与滤波
图像处理·人工智能·计算机视觉
江上鹤.14811 小时前
Day37 MLP神经网络的训练
人工智能·深度学习·神经网络