FreeU: Free Lunch in Diffusion U-Net——【代码复现】

这篇文章发表于CVPR 2024,官网地址:ChenyangSi/FreeU: FreeU: Free Lunch in Diffusion U-Net (CVPR2024 Oral) (github.com)

一、环境准备

提前准备好python、pytorch环境

二、下载项目依赖

demo下有一个requirements.txt文件,

复制代码
pip install -r requirements.txt

三、运行

这个项目运行示例其实相对简单,这里直接跑它的gradio图形化界面就行:

复制代码
python demo/app.py

注:

1. 加载预训练模型:

这里我们要在app.py中把它默认的模型加载路径改成我们自己的,当然你也可以直接用默认的。前提是你的模型放在根目录下。

2.gradio版本

这个项目它需要使用gradio<=3.50.0的,不要超过3.50.0。

3.设置url

如果是在服务器上跑的代码,在我们本机这里是无法访问服务器的端口地址的,所以我们在app.py文件中,需要设置一下启动参数,我们需要将server_name改成服务器的ip地址,server_port是设置的端口号。然后再启动我们就可以在自己的电脑上用浏览器访问了。

4.diffusers版本

如果遇到这种类似的问题,看看你的diffusers版本是否和项目需求一致,这个diffusers包版本之间不兼容,真是特别让人头疼的地方。

四、图片生成

一切顺利的话,访问url,图形化界面如下:

这里我直接使用它的示例提示测试了一下,效果如下:

相关推荐
QQ676580081 小时前
智慧工厂之扬尘识别 铲车装载识别 工程重型机械识别 磁铁识别 深度学习YOLO格式图像识别第10435期
人工智能·深度学习·yolo·扬尘识别·铲车装载·工程重型机械·磁铁识别
思绪无限2 小时前
YOLOv5至YOLOv12升级:行人跌倒检测系统的设计与实现(完整代码+界面+数据集项目)
深度学习·yolo·目标检测·yolov12·yolo全家桶·行人跌倒检测系统
AI医影跨模态组学2 小时前
PLOS Medicine 中山大学肿瘤防治中心蔡木炎等团队:基于多视角深度学习的组织病理学分析用于II期结直肠癌的预后与治疗分层
人工智能·深度学习·论文·医学·医学影像
Aray12342 小时前
大模型推理全栈技术解析:从Transformer到RoPE/YaRN的上下文优化
人工智能·深度学习·transformer
思绪无限3 小时前
YOLOv5至YOLOv12升级:行人车辆检测与计数识别系统的设计与实现(完整代码+界面+数据集项目)
人工智能·深度学习·yolo·目标检测·yolov12·yolo全家桶·行人车辆检测与计数
hsg773 小时前
简述:torchgeo
人工智能·深度学习
程序媛徐师姐3 小时前
Python基于深度学习的手写输入识别系统【附源码、文档说明】
python·深度学习·python深度学习·手写输入识别系统·python手写输入识别系统·python手写输入识别·深度学习手写输入识别
思绪无限3 小时前
YOLOv5至YOLOv12升级:个人防具检测系统的设计与实现(完整代码+界面+数据集项目)
深度学习·yolo·目标检测·yolov12·yolo全家桶·个人防具检测
石榴树下的七彩鱼4 小时前
OCR 识别不准确怎么办?模糊 / 倾斜 / 反光图片优化实战(附完整解决方案 + 代码示例)
图像处理·人工智能·后端·ocr·api·文字识别·图片识别
菱玖4 小时前
Transformer 架构详解
人工智能·深度学习·transformer