技术栈

vla模型

机器觉醒时代
17 小时前
人工智能·具身智能·vla模型
具身智能VLA困于“数据泥潭”,人类活动视频数据是否是“破局之钥”?尽管当前的视觉-语言-动作(VLA)模型已展现出显著进展,但其在新场景和与复杂物体交互中的性能会显著下降,在遵循指令方面落后于像LLaVA 这样的大型多模态模型(LMM)。