第七十五周周报

学习目标:

实验

学习时间:

2024.2.17-2024.2.23

学习产出:

实验

1、根据stylegan2作者的回复,对比了tensorflow版本和ViTGAN的参数,重新修改了stylegan2的参数,目前正在跑。

2、根据DViTGAN的随机数种子,重新实验ViTGAN,进行定性实验。

3、lusn128的结果不理想,正在调参。

论文

根据审稿意见,大概看了一下审稿人提到的三篇Diffusion与Vision Transformer结合的论文。

Scalable Diffusion Models with Transformers:将U-Net替换为Vision Transformer,在潜空间中训练扩散模型

DiffiT: Diffusion Vision Transformers for Image Generation:将U-Net替换为一个u形编码器和解码器,引入时间依赖自注意力模块以便注意力层在去噪过程的不同阶段能够进行有效调整。

All are Worth Words: A ViT Backbone for Diffusion Models:设计一个通用的基于ViT的架构U-ViT,将时间、条件和噪声图像patch在内的所有输入作为标记,并在浅层和深层之间采用long skip connection。

相关推荐
badhope1 小时前
Mobile-Skills:移动端技能可视化的创新实践
开发语言·人工智能·git·智能手机·github
吴佳浩2 小时前
GPU 编号进阶:CUDA\_VISIBLE\_DEVICES、多进程与容器化陷阱
人工智能·pytorch·python
吴佳浩2 小时前
GPU 编号错乱踩坑指南:PyTorch cuda 编号与 nvidia-smi 不一致
人工智能·pytorch·nvidia
小饕3 小时前
苏格拉底式提问对抗315 AI投毒:实操指南
网络·人工智能
卧蚕土豆3 小时前
【有啥问啥】OpenClaw 安装与使用教程
人工智能·深度学习
GoCodingInMyWay3 小时前
开源好物 26/03
人工智能·开源
AI科技星3 小时前
全尺度角速度统一:基于 v ≡ c 的纯推导与验证
c语言·开发语言·人工智能·opencv·算法·机器学习·数据挖掘
zhangfeng11333 小时前
Windows 的 Git Bash 中使用 md5sum 命令非常简单 md5做文件完整性检测 WinRAR 可以计算文件的 MD5 值
人工智能·windows·git·bash
monsion3 小时前
OpenCode 学习指南
人工智能·vscode·架构
藦卡机器人3 小时前
中国工业机器人发展现状
大数据·人工智能·机器人