青稞Talk预告!面向自动驾驶与物理世界对齐的视频生成模型

青稞Talk预告!面向自动驾驶与物理世界对齐的视频生成模型

为何现有视频生成模型难以理解物理世界,无法生成运动合理的视频结果?基于认知心理学研究,我们重新审视现有视频生成模型,认为生成运动合理的视频其实是和生成高视觉质量视频同样困难的任务,而现有一阶段建模方式更关注视觉质量,缺少对运动的关注。

为此,香港科技大学(广州)的研究者提出了两阶段模型 Motion Dreamer,通过生成中间运动表示,将运动和视觉质量进行解耦,从而生成运动合理且高视觉质量的视频。

复制代码
Abs:https://arxiv.org/pdf/2412.00547

1月14日19:00 ,青稞Talk 第37期,香港科技大学(广州)博士生许添硕,将直播分享《Motion Dreamer:面向自动驾驶与物理世界对齐的视频生成模型》。

许添硕,香港科技大学(广州)博士生,导师为陈颖聪教授,研究兴趣是自动驾驶、视频生成。

相关推荐
Newfocus!14 分钟前
宝宝树以“奇迹2.0”重构营销范式:AI驱动母婴行业迈向全域智能
人工智能
gddkxc24 分钟前
悟空 AI CRM 的回款功能:加速资金回流,保障企业财务健康
大数据·人工智能·信息可视化
芥子沫29 分钟前
经典机器学习&深度学习领域数据集介绍
人工智能·深度学习·机器学习·数据集
zy_destiny34 分钟前
【工业场景】用YOLOv8实现行人识别
人工智能·深度学习·opencv·算法·yolo·机器学习
优宁维生物35 分钟前
白细胞偏低:原因解析与应对策略
经验分享
Guheyunyi38 分钟前
用气安全与能效优化平台
运维·网络·人工智能·安全·音视频
万悉科技39 分钟前
专家深度解析5种关键优化方法,助力品牌在AI搜索引擎中脱颖而出
经验分享
万悉科技1 小时前
被忽略的内容结构化:提升AI搜索引擎可见性的关键趋势
经验分享
shimly1234561 小时前
(done) 并行计算 CS149 Lecture10 (DNN评估与优化)
人工智能·神经网络·dnn·并行计算
qyresearch_1 小时前
汽车用颗粒物传感器:市场趋势、技术革新与行业挑战
人工智能·汽车