大家应该都听到或看到过类似的观点:现在的 AI 就是一个玩具,也就能聊聊天,生成个搞笑图片。
尽管这一观点带有一定夸张成分,但不可否认的是,当前阶段 AI 应用确实集中在知识处理领域,距离直接改变世界还有一段路要走。
AI 能力范围的进化
但,AI 的能力范围其实一直在进化。
最开始,大模型就是聊天,大家在 ChatGPT 上聊的不亦乐乎,甚至诞生了很多现象级的情感陪伴应用。
但很快,大家就开始尝试接入各类信息化能力,为此还专门设计了 MCP,以此方便各类服务的快速接入。
到这时,AI 其实已经通过智能体在影响世界了,比如 AI 编程、AI 审稿、AI 辅助诊断等。
但此时的 AI 应用场景,依然有很多限制,比如:不能直接改善我的生活,不能直接替代生产过程。
为了解决这一困境,我们需要帮助 AI 在感知、执行、规划三个方面进一步进化。
感知
现有多模态大模型的图片、音频、视频方式还是有点狭隘。
后续我们将会通过物联网手段,直接接入更多数据来源,扩展信息类型,让 AI 可以连接更多场景。
执行
有了输入,经过 AI 加工处理,想要直接改变世界就只差工具了。
大家应该都猜到了,就是现在火热的另一个领域:具身智能。
通过将 AI 接入机械臂、机器人中,可以将模型能力输出到物理世界,以解决各自领域的实际需求。
规划
现有大模型与真实世界的串联,大多是将各类输入转为输入文本,AI处理文本,再将输出文本解析为相关动作。
倒是可以实现"输入-智能处理-输出"的链条,但是非原生的模型支持会造成信息的丢失,从而导致整体表现不那么美好。
因此,后续的智能核心将会是各种场景的专有模型,比如:工业模型、医疗模型,或者更为通用的世界模型。
结语
好了,今天就到这里,主要是给大家汇报一下,最近工作内容的变化。
后续也会增加这方面内容的分享,欢迎大家继续关注哈~