技术栈

wam

v_JULY_v
10 小时前
视频扩散模型·世界动作模型·wam
DreamZero——同时预测未来视觉状态与动作的世界动作模型:解决当下VLA如果人类不示教则理论很强但具体操作还不强的弊病最新的VLA模型在语义泛化方面表现出色,但在新环境中对未见过的物理动作的泛化却举步维艰那咋整呢由于视频生成模型在从OpenAI发布Sora至今的两年时间,变得越来越好了,能更好地生成符合物理规律的动作视频了,使得在今年年初,世界模型开始火热,给大家带来新的希望
我是有底线的