技术栈
清华pad
v_JULY_v
2 个月前
视频生成
·
扩散transformer
·
dit
·
机器人动作预测
·
扩散过程
·
改造dit
·
清华pad
Diffusion Transformer(DiT)——将扩散过程中的U-Net换成ViT:近频繁用于视频生成与机器人动作预测(含清华PAD详解)
本文最开始属于此文《视频生成Sora的全面解析:从AI绘画、ViT到ViViT、TECO、DiT、VDT、NaViT等》