视频扩散模型

DreamZero——同时预测未来视觉状态与动作的世界动作模型：解决当下VLA如果人类不示教则理论很强但具体操作还不强的弊病最新的VLA模型在语义泛化方面表现出色，但在新环境中对未见过的物理动作的泛化却举步维艰那咋整呢由于视频生成模型在从OpenAI发布Sora至今的两年时间，变得越来越好了，能更好地生成符合物理规律的动作视频了，使得在今年年初，世界模型开始火热，给大家带来新的希望

【论文精读】CMD：迈向高效视频生成的新范式标题：EFFICIENT VIDEO DIFFUSION MODELS VIA CONTENT-FRAME MOTION-LATENT DECOMPOSITION

【论文精读】SV3D：基于视频扩散模型的单图多视角合成与3D生成论文标题：SV3D: Novel Multi-view Synthesis and 3D Generation from a Single Image using Latent Video Diffusion 作者：Vikram Voleti, Chun-Han Yao, Mark Boss 等

【论文精读】GenRec：基于扩散模型统一视频生成与识别任务标题：GenRec: Unifying Video Generation and Recognition with Diffusion Models

爱分享的飘哥

第六十一章：AI 模型的“视频加速术”：Wan视频扩散模型优化你可能已经体验过像 Stable Diffusion 这样的文生图模型，它们能够在几秒内生成高质量的图片。

【AIGC视频生成】视频扩散模型(综述+最新进展)最新综述《A Survey on Video Diffusion Models》来自于复旦大学，论文地址为：https://arxiv.org/abs/2310.10647

【EAI 027】Learning Interactive Real-World Simulators论文标题：Learning Interactive Real-World Simulators 论文作者：Mengjiao Yang, Yilun Du, Kamyar Ghasemipour, Jonathan Tompson, Leslie Kaelbling, Dale Schuurmans, Pieter Abbeel 作者单位：UC Berkeley, Google DeepMind, MIT, University of Alberta 论文原文：https://arxiv.org/abs/2

我是有底线的