AI 不只是聊天：聊聊我最近在做的新方向

飞哥数智坊2025-12-05 22:07

大家应该都听到或看到过类似的观点：现在的 AI 就是一个玩具，也就能聊聊天，生成个搞笑图片。

尽管这一观点带有一定夸张成分，但不可否认的是，当前阶段 AI 应用确实集中在知识处理领域，距离直接改变世界还有一段路要走。

AI 能力范围的进化

但，AI 的能力范围其实一直在进化。

最开始，大模型就是聊天，大家在 ChatGPT 上聊的不亦乐乎，甚至诞生了很多现象级的情感陪伴应用。

但很快，大家就开始尝试接入各类信息化能力，为此还专门设计了 MCP，以此方便各类服务的快速接入。

到这时，AI 其实已经通过智能体在影响世界了，比如 AI 编程、AI 审稿、AI 辅助诊断等。

但此时的 AI 应用场景，依然有很多限制，比如：不能直接改善我的生活，不能直接替代生产过程。

为了解决这一困境，我们需要帮助 AI 在感知、执行、规划三个方面进一步进化。

现有多模态大模型的图片、音频、视频方式还是有点狭隘。

后续我们将会通过物联网手段，直接接入更多数据来源，扩展信息类型，让 AI 可以连接更多场景。

有了输入，经过 AI 加工处理，想要直接改变世界就只差工具了。

大家应该都猜到了，就是现在火热的另一个领域：具身智能。

通过将 AI 接入机械臂、机器人中，可以将模型能力输出到物理世界，以解决各自领域的实际需求。

现有大模型与真实世界的串联，大多是将各类输入转为输入文本，AI处理文本，再将输出文本解析为相关动作。

倒是可以实现"输入-智能处理-输出"的链条，但是非原生的模型支持会造成信息的丢失，从而导致整体表现不那么美好。

因此，后续的智能核心将会是各种场景的专有模型，比如：工业模型、医疗模型，或者更为通用的世界模型。

好了，今天就到这里，主要是给大家汇报一下，最近工作内容的变化。

后续也会增加这方面内容的分享，欢迎大家继续关注哈~