AI 不只是聊天:聊聊我最近在做的新方向

大家应该都听到或看到过类似的观点:现在的 AI 就是一个玩具,也就能聊聊天,生成个搞笑图片。

尽管这一观点带有一定夸张成分,但不可否认的是,当前阶段 AI 应用确实集中在知识处理领域,距离直接改变世界还有一段路要走。

AI 能力范围的进化

但,AI 的能力范围其实一直在进化。

最开始,大模型就是聊天,大家在 ChatGPT 上聊的不亦乐乎,甚至诞生了很多现象级的情感陪伴应用。

但很快,大家就开始尝试接入各类信息化能力,为此还专门设计了 MCP,以此方便各类服务的快速接入。

到这时,AI 其实已经通过智能体在影响世界了,比如 AI 编程、AI 审稿、AI 辅助诊断等。

但此时的 AI 应用场景,依然有很多限制,比如:不能直接改善我的生活,不能直接替代生产过程。

为了解决这一困境,我们需要帮助 AI 在感知、执行、规划三个方面进一步进化。

感知

现有多模态大模型的图片、音频、视频方式还是有点狭隘。

后续我们将会通过物联网手段,直接接入更多数据来源,扩展信息类型,让 AI 可以连接更多场景。

执行

有了输入,经过 AI 加工处理,想要直接改变世界就只差工具了。

大家应该都猜到了,就是现在火热的另一个领域:具身智能。

通过将 AI 接入机械臂、机器人中,可以将模型能力输出到物理世界,以解决各自领域的实际需求。

规划

现有大模型与真实世界的串联,大多是将各类输入转为输入文本,AI处理文本,再将输出文本解析为相关动作。

倒是可以实现"输入-智能处理-输出"的链条,但是非原生的模型支持会造成信息的丢失,从而导致整体表现不那么美好。

因此,后续的智能核心将会是各种场景的专有模型,比如:工业模型、医疗模型,或者更为通用的世界模型。

结语

好了,今天就到这里,主要是给大家汇报一下,最近工作内容的变化。

后续也会增加这方面内容的分享,欢迎大家继续关注哈~

相关推荐
Mintopia11 小时前
🌌 多模态 AI 的崛起:语言、图像与视频的融合革命
人工智能·llm·aigc
Linux猿11 小时前
365科技简报 12月25日 星期四
人工智能
juhanishen11 小时前
Agentic AI: Chain of Thoughts (COT) CrewAI 一步步解释,从 0 到 1
人工智能·chatgpt·cot·agentic ai·agenticai·chain of though
rit843249911 小时前
基于MATLAB的图像融合方法:IHS、PCA、拉普拉斯、PCNN、小波
人工智能·计算机视觉·matlab
MarkHD11 小时前
智能体在车联网中的应用:第25天 深度Q网络(DQN)实战:在CartPole环境中用PyTorch从零实现
人工智能·pytorch·python
Pocker_Spades_A11 小时前
AI Ping 上线 GLM-4.7 与 MiniMax M2.1:两款国产旗舰模型免费用!
大数据·数据库·人工智能
yuegu77711 小时前
基于 ModelEngine 构建菜谱推荐智能体(CookAdvisor Pro)实践指南
人工智能
玖日大大11 小时前
基于卷积神经网络的图像分类实践与原理解析
人工智能·分类·cnn
Godspeed Zhao11 小时前
自动驾驶中的传感器技术79——Sensor Fusion(2)
人工智能·fpga开发·自动驾驶
广州服务器托管11 小时前
[2025.12.25] Win10.LTSC2021极速响应养老版19045.3208轻精简全功能【可更新】PIIS出品 老电脑福利 老旧电脑流畅运行
运维·人工智能·计算机网络·云计算·电脑·可信计算技术