AI 不只是聊天:聊聊我最近在做的新方向

大家应该都听到或看到过类似的观点:现在的 AI 就是一个玩具,也就能聊聊天,生成个搞笑图片。

尽管这一观点带有一定夸张成分,但不可否认的是,当前阶段 AI 应用确实集中在知识处理领域,距离直接改变世界还有一段路要走。

AI 能力范围的进化

但,AI 的能力范围其实一直在进化。

最开始,大模型就是聊天,大家在 ChatGPT 上聊的不亦乐乎,甚至诞生了很多现象级的情感陪伴应用。

但很快,大家就开始尝试接入各类信息化能力,为此还专门设计了 MCP,以此方便各类服务的快速接入。

到这时,AI 其实已经通过智能体在影响世界了,比如 AI 编程、AI 审稿、AI 辅助诊断等。

但此时的 AI 应用场景,依然有很多限制,比如:不能直接改善我的生活,不能直接替代生产过程。

为了解决这一困境,我们需要帮助 AI 在感知、执行、规划三个方面进一步进化。

感知

现有多模态大模型的图片、音频、视频方式还是有点狭隘。

后续我们将会通过物联网手段,直接接入更多数据来源,扩展信息类型,让 AI 可以连接更多场景。

执行

有了输入,经过 AI 加工处理,想要直接改变世界就只差工具了。

大家应该都猜到了,就是现在火热的另一个领域:具身智能。

通过将 AI 接入机械臂、机器人中,可以将模型能力输出到物理世界,以解决各自领域的实际需求。

规划

现有大模型与真实世界的串联,大多是将各类输入转为输入文本,AI处理文本,再将输出文本解析为相关动作。

倒是可以实现"输入-智能处理-输出"的链条,但是非原生的模型支持会造成信息的丢失,从而导致整体表现不那么美好。

因此,后续的智能核心将会是各种场景的专有模型,比如:工业模型、医疗模型,或者更为通用的世界模型。

结语

好了,今天就到这里,主要是给大家汇报一下,最近工作内容的变化。

后续也会增加这方面内容的分享,欢迎大家继续关注哈~

相关推荐
K姐研究社2 分钟前
阿里JVS Claw实测 – 手机一键部署 OpenClaw,开箱即用
人工智能·智能手机·aigc·飞书
卷积殉铁子3 分钟前
从“手动挡”到“自动驾驶”:OpenClaw如何让AI开发变成“说话就行”
人工智能
机器之心7 分钟前
扎克伯格正在打造自己的「AI分身」,并计划裁掉1.6万人
人工智能·openai
机器之心12 分钟前
必看!Sebastian Raschka新博客盘点了所有主要注意力机制
人工智能·openai
Kel1 小时前
深入剖析 openai-node 源码:一个工业级 TypeScript SDK 的架构之美
javascript·人工智能·架构
岛雨QA1 小时前
Skill学习指南🧑‍💻
人工智能·agent·ai编程
波动几何1 小时前
从人性到无名:一条向内的觉悟之路
人工智能
EllenLiu2 小时前
架构演进与性能压榨:在金融 RAG 中引入条款森林 (FoC)
人工智能·架构
IT_陈寒2 小时前
深入理解JavaScript:核心原理与最佳实践
前端·人工智能·后端
Presto2 小时前
AI 时代 .env 文件不再安全——我试图找到替代方案,然后撞上了一堵墙
人工智能