青稞Talk预告!面向自动驾驶与物理世界对齐的视频生成模型

青稞Talk预告!面向自动驾驶与物理世界对齐的视频生成模型

为何现有视频生成模型难以理解物理世界,无法生成运动合理的视频结果?基于认知心理学研究,我们重新审视现有视频生成模型,认为生成运动合理的视频其实是和生成高视觉质量视频同样困难的任务,而现有一阶段建模方式更关注视觉质量,缺少对运动的关注。

为此,香港科技大学(广州)的研究者提出了两阶段模型 Motion Dreamer,通过生成中间运动表示,将运动和视觉质量进行解耦,从而生成运动合理且高视觉质量的视频。

Abs:https://arxiv.org/pdf/2412.00547

1月14日19:00 ,青稞Talk 第37期,香港科技大学(广州)博士生许添硕,将直播分享《Motion Dreamer:面向自动驾驶与物理世界对齐的视频生成模型》。

许添硕,香港科技大学(广州)博士生,导师为陈颖聪教授,研究兴趣是自动驾驶、视频生成。

相关推荐
liruiqiang055 分钟前
机器学习之基本概念 - 特征、标签、样本
人工智能·机器学习
程序员正茂17 分钟前
Win10微调大语言模型ChatGLM2-6B
人工智能·语言模型·自然语言处理·chatglm2-6b
赛逸展张胜20 分钟前
CES Asia 2025科技盛宴,AI智能体成焦点
大数据·人工智能·科技
刘争Stanley21 分钟前
训练一只AI:深度学习在自然语言处理中的应用
人工智能·深度学习·算法·链表·自然语言处理·贪心算法·排序算法
XianxinMao24 分钟前
深度解析:语言模型的推理能力与强化学习优化
人工智能·深度学习
京报商业26 分钟前
蓝笔科技 | 超凡妈妈赋能计划-【北大生涯规划师特别企划】
人工智能·科技
kv183036 分钟前
详解opencv resize之INTER_LINEAR和INTER_AREA
人工智能·opencv·计算机视觉·双线性插值·inter_linear
云空37 分钟前
《2025 CES 国际消费电子展:科技狂潮,未来已来》
人工智能·科技
cnbestec1 小时前
Optocon光纤温度传感器原理及技术亮点
人工智能·科技·机器人
高德诚1 小时前
智能家居的“肌肉”:深度解析舵机技术
人工智能