第七十五周周报

学习目标:

实验

学习时间:

2024.2.17-2024.2.23

学习产出:

实验

1、根据stylegan2作者的回复,对比了tensorflow版本和ViTGAN的参数,重新修改了stylegan2的参数,目前正在跑。

2、根据DViTGAN的随机数种子,重新实验ViTGAN,进行定性实验。

3、lusn128的结果不理想,正在调参。

论文

根据审稿意见,大概看了一下审稿人提到的三篇Diffusion与Vision Transformer结合的论文。

Scalable Diffusion Models with Transformers:将U-Net替换为Vision Transformer,在潜空间中训练扩散模型

DiffiT: Diffusion Vision Transformers for Image Generation:将U-Net替换为一个u形编码器和解码器,引入时间依赖自注意力模块以便注意力层在去噪过程的不同阶段能够进行有效调整。

All are Worth Words: A ViT Backbone for Diffusion Models:设计一个通用的基于ViT的架构U-ViT,将时间、条件和噪声图像patch在内的所有输入作为标记,并在浅层和深层之间采用long skip connection。

相关推荐
背太阳的牧羊人8 分钟前
BitsAndBytes(简称 BnB)是一个用于“压缩”大语言模型的工具包
人工智能·语言模型·自然语言处理
思绪漂移13 分钟前
大型语言模型(LLM)的构建模块
人工智能·语言模型·自然语言处理
LXJSWD16 分钟前
tensorflow GPU训练loss与val loss值差距过大问题
人工智能·python·tensorflow
阿星AI工作室18 分钟前
n8n教程:5分钟部署+自动生AI日报并写入飞书多维表格
前端·人工智能·后端
MidJourney中文版41 分钟前
小智AI玩具市场爆发:四大品牌领跑情感交互新赛道
人工智能·交互
腾讯云开发者1 小时前
从大模型到具身智能进化,AI 应用的产业落地路在何方?
人工智能
李子圆圆1 小时前
地下安全防线:电缆通道防外破地钉如何守护城市隐形生命线
大数据·人工智能
火山引擎边缘云1 小时前
更强模型效果!豆包大模型 1.6 系列上线边缘大模型网关,最高申领1000万免费 Tokens
人工智能·aigc
我在北京coding1 小时前
基于OpenCv(开源计算机视觉库)的图像旋转匹配
人工智能·opencv·计算机视觉
西猫雷婶1 小时前
python学智能算法(十四)|机器学习朴素贝叶斯方法进阶-CountVectorizer文本处理简单测试
人工智能·python·机器学习