dit

好评笔记18 天前
论文阅读·人工智能·深度学习·计算机视觉·aigc·dit·u-vit
多模态论文笔记——U-ViT大家好,这里是好评笔记,公主号:Goodnote,专栏文章私信限时Free。本文详细介绍U-ViT的模型架构和实验细节,虽然没有后续的DiT在AIGC领域火爆,但为后来的研究奠定了基础,但其开创性的探索值得学习。
v_JULY_v25 天前
视频生成·扩散transformer·dit·机器人动作预测·扩散过程·改造dit·清华pad
Diffusion Transformer(DiT)——将扩散过程中的U-Net换成ViT:近频繁用于视频生成与机器人动作预测(含清华PAD详解)本文最开始属于此文《视频生成Sora的全面解析:从AI绘画、ViT到ViViT、TECO、DiT、VDT、NaViT等》
m0_608570984 个月前
diffusion·扩散模型·dit
扩散模型学习先验概率和后验概率是贝叶斯统计学中的两个重要概念,用于描述事件发生的概率在更新观测数据后的变化情况。先验概率(Prior Probability):
旋转的油纸伞6 个月前
音视频·svd·视频生成·sora·dit
视频生成【文章汇总】SVD, Sora, Latte, VideoCrafter12, DiT...Authors: Xuan Ju, Yiming Gao, Zhaoyang Zhang, Ziyang Yuan, Xintao Wang, Ailing Zeng, Yu Xiong, Qiang Xu, Ying Shan
一颗小树x7 个月前
stable diffusion·扩散模型·dit
Stable Diffusion 3 文本生成图像 在线体验 原理分析本文分享使用Stable Diffusion 3实现文本生成图像,可以通过在线网页中免费使用的,也有API等方式访问。
清风202210 个月前
论文阅读·transformer·扩散模型·dit
【扩散模型系列2】DiT 《Scalable Diffusion Models with Transformers》论文阅读《Scalable Diffusion Models with Transformers》《基于transformer的可扩展扩散模型》
v_JULY_v1 年前
视频生成·扩散transformer·vivit·dit·videopoet·openai sora
OpenAI视频生成模型Sora的全面解析:从ViViT、扩散Transformer到NaViT、VideoPoet真没想到,距离视频生成上一轮的集中爆发(详见《视频生成发展史:从Gen2、Emu Video到PixelDance、SVD、Pika 1.0、W.A.L.T》)才过去三个月,没想OpenAI一出手,该领域又直接变天了