马斯克也要入局世界模型大战了。
最近,马斯克旗下的人工智能公司xAI正加速推进世界模型研发。据《金融时报》报道,xAI已从英伟达挖来两名核心研究员,计划将世界模型技术应用于游戏和机器人领域。

世界模型是一种能够理解物理环境动态特征的生成式AI模型,它可以利用文字、图像、视频及动作数据生成影片,并实现对现实世界的自主导航与模拟。与当前主流的大语言模型不同,世界模型通过学习视频和机器人数据来理解现实世界,致力于将AI能力拓展至实体产品。
xAI从英伟达挖走的研究员Zeeshan Patel和Ethan He,均具备丰富的世界模型开发经验。Zeeshan Patel专攻多模态模型与物理AI,Ethan He的研究方向涵盖视频自监督学习与多模态模型。

值得关注的是,两人曾参与英伟达Omniverse平台的开发,该平台以先进的物理仿真技术著称,为世界模型的研发提供了关键技术基础。
世界模型被视为实现通用人工智能(AGI)的关键路径,谷歌、Meta、英伟达等科技巨头均已在此领域布局。英伟达在今年1月发布的Cosmos平台训练数据达9000万亿token,覆盖机器人、驾驶等多种场景。这一领域的技术竞争正日趋激烈。
xAI计划通过世界模型实现"物理规律理解",使AI能够模拟真实环境并进行实时交互。
首批应用将聚焦于游戏领域,目标是在2026年底推出由AI动态生成的3D游戏,这些游戏的场景将能够根据玩家的行为实时变化。从长期规划来看,该技术有望延伸至机器人、自动驾驶等领域,并与马斯克旗下的特斯拉、Neuralink等形成协同效应。
马斯克在X平台上发文确认,xAI目标是在明年年底前推出"一款由AI生成的优秀游戏"。这一表态与他在去年设定的目标一致,显示出马斯克对AI生成游戏领域的坚定投入。

从技术层面看,世界模型与当前的视频生成模型存在显著差异。OpenAI的Sora等模型通过训练数据逐帧生成视频,而世界模型则致力于实时理解物理因果关系,掌握物体在不同环境中的互动机制。这种技术跨越将使AI不仅能生成内容,还能在内部模拟出一个真实世界的副本。
xAI为了推进世界模型研发,正在组建专门的多模态团队。根据招聘信息,这支团队将包括多个方向的技术人才,涵盖音频理解与生成、多模态建模与数据系统等领域。
世界模型的前景正在受到包括李飞飞在内的业界专家寄予的厚望。英伟达曾表示,世界模型的潜在市场规模可能接近全球经济总量。这种估测基于世界模型可能带来的全面技术变革,以及其在各行各业的应用潜力。
然而,世界模型的研发仍面临巨大技术挑战。要找到足够的数据来模拟现实世界并训练这些模型,已被证明既困难又成本昂贵。
未来,世界模型可能将成为连接马斯克旗下多家公司的技术纽带。xAI负责研发模型,特斯拉提供机器人和自动驾驶数据,Neuralink开发脑机接口,X平台则作为社交与实时反馈的渠道。如果这些板块能通过世界模型有效协同,马斯克的AI生态系统将形成完整闭环。
随着xAI加入世界模型竞赛,全球AI格局可能迎来新的变化。在谷歌、Meta、英伟达等巨头均已布局的背景下,xAI凭借马斯克的多公司协同效应和独特的研发路径,有望在这一关键AI技术领域占据重要位置。
世界模型的发展不仅关乎技术进步,更影响着AI未来的应用方向。而随着研发进程的加速,世界模型可能成为实现通用人工智能道路上的重要里程碑。