AI 不只是聊天:聊聊我最近在做的新方向

大家应该都听到或看到过类似的观点:现在的 AI 就是一个玩具,也就能聊聊天,生成个搞笑图片。

尽管这一观点带有一定夸张成分,但不可否认的是,当前阶段 AI 应用确实集中在知识处理领域,距离直接改变世界还有一段路要走。

AI 能力范围的进化

但,AI 的能力范围其实一直在进化。

最开始,大模型就是聊天,大家在 ChatGPT 上聊的不亦乐乎,甚至诞生了很多现象级的情感陪伴应用。

但很快,大家就开始尝试接入各类信息化能力,为此还专门设计了 MCP,以此方便各类服务的快速接入。

到这时,AI 其实已经通过智能体在影响世界了,比如 AI 编程、AI 审稿、AI 辅助诊断等。

但此时的 AI 应用场景,依然有很多限制,比如:不能直接改善我的生活,不能直接替代生产过程。

为了解决这一困境,我们需要帮助 AI 在感知、执行、规划三个方面进一步进化。

感知

现有多模态大模型的图片、音频、视频方式还是有点狭隘。

后续我们将会通过物联网手段,直接接入更多数据来源,扩展信息类型,让 AI 可以连接更多场景。

执行

有了输入,经过 AI 加工处理,想要直接改变世界就只差工具了。

大家应该都猜到了,就是现在火热的另一个领域:具身智能。

通过将 AI 接入机械臂、机器人中,可以将模型能力输出到物理世界,以解决各自领域的实际需求。

规划

现有大模型与真实世界的串联,大多是将各类输入转为输入文本,AI处理文本,再将输出文本解析为相关动作。

倒是可以实现"输入-智能处理-输出"的链条,但是非原生的模型支持会造成信息的丢失,从而导致整体表现不那么美好。

因此,后续的智能核心将会是各种场景的专有模型,比如:工业模型、医疗模型,或者更为通用的世界模型。

结语

好了,今天就到这里,主要是给大家汇报一下,最近工作内容的变化。

后续也会增加这方面内容的分享,欢迎大家继续关注哈~

相关推荐
珠海西格电力科技1 小时前
微电网控制策略基础:集中式、分布式与混合式控制逻辑
网络·人工智能·分布式·物联网·智慧城市·能源
Java后端的Ai之路2 小时前
【RAG技术】- RAG系统调优手段之高效召回(通俗易懂附案例)
人工智能·rag·rag系统·召回·rag调优
草莓熊Lotso2 小时前
Linux 基础 IO 初步解析:从 C 库函数到系统调用,理解文件操作本质
linux·运维·服务器·c语言·数据库·c++·人工智能
Cx330❀2 小时前
从零实现Shell命令行解释器:原理与实战(附源码)
大数据·linux·数据库·人工智能·科技·elasticsearch·搜索引擎
Niuguangshuo8 小时前
深入解析Stable Diffusion基石——潜在扩散模型(LDMs)
人工智能·计算机视觉·stable diffusion
迈火8 小时前
SD - Latent - Interposer:解锁Stable Diffusion潜在空间的创意工具
人工智能·gpt·计算机视觉·stable diffusion·aigc·语音识别·midjourney
wfeqhfxz25887828 小时前
YOLO13-C3k2-GhostDynamicConv烟雾检测算法实现与优化
人工智能·算法·计算机视觉
芝士爱知识a9 小时前
2026年AI面试软件推荐
人工智能·面试·职场和发展·大模型·ai教育·考公·智蛙面试
Li emily9 小时前
解决港股实时行情数据 API 接入难题
人工智能·python·fastapi
Aaron15889 小时前
基于RFSOC的数字射频存储技术应用分析
c语言·人工智能·驱动开发·算法·fpga开发·硬件工程·信号处理