视频扩散模型

v_JULY_v20 天前
视频扩散模型·世界动作模型·wam
DreamZero——同时预测未来视觉状态与动作的世界动作模型:解决当下VLA如果人类不示教则理论很强但具体操作还不强的弊病最新的VLA模型在语义泛化方面表现出色,但在新环境中对未见过的物理动作的泛化却举步维艰那咋整呢由于视频生成模型在从OpenAI发布Sora至今的两年时间,变得越来越好了,能更好地生成符合物理规律的动作视频了,使得在今年年初,世界模型开始火热,给大家带来新的希望
m0_650108244 个月前
人工智能·论文精读·视频扩散模型·高效生成·内容 - 运动分解·latent 空间
【论文精读】CMD:迈向高效视频生成的新范式标题:EFFICIENT VIDEO DIFFUSION MODELS VIA CONTENT-FRAME MOTION-LATENT DECOMPOSITION
m0_650108244 个月前
人工智能·论文精读·视频扩散模型·单图 3d 生成
【论文精读】SV3D:基于视频扩散模型的单图多视角合成与3D生成论文标题:SV3D: Novel Multi-view Synthesis and 3D Generation from a Single Image using Latent Video Diffusion 作者:Vikram Voleti, Chun-Han Yao, Mark Boss 等
m0_650108244 个月前
论文精读·视频扩散模型·视频生成与识别任务联合优化·时空表征·随机帧条件
【论文精读】GenRec:基于扩散模型统一视频生成与识别任务标题:GenRec: Unifying Video Generation and Recognition with Diffusion Models
爱分享的飘哥7 个月前
人工智能·剪枝·tensorrt·量化·模型优化·视频扩散模型·cuda graph
第六十一章:AI 模型的“视频加速术”:Wan视频扩散模型优化你可能已经体验过像 Stable Diffusion 这样的文生图模型,它们能够在几秒内生成高质量的图片。
杀生丸学AI1 年前
aigc·音视频·sora·视频扩散模型·sam2·一键生成视频
【AIGC视频生成】视频扩散模型(综述+最新进展)最新综述《A Survey on Video Diffusion Models》来自于复旦大学,论文地址为:https://arxiv.org/abs/2310.10647
datamonday2 年前
人工智能·强化学习·具身智能·视频扩散模型·世界模拟器
【EAI 027】Learning Interactive Real-World Simulators论文标题:Learning Interactive Real-World Simulators 论文作者:Mengjiao Yang, Yilun Du, Kamyar Ghasemipour, Jonathan Tompson, Leslie Kaelbling, Dale Schuurmans, Pieter Abbeel 作者单位:UC Berkeley, Google DeepMind, MIT, University of Alberta 论文原文:https://arxiv.org/abs/2
我是有底线的