AI新词太多?把它们串成一条线就清楚了

AI新词太多?把它们串成一条线就清楚了

2023年你学会了一个词:大模型。2024年又冒出来RAG、Agent、Function Calling。2025年多了一堆o1、reasoning、multimodal。2026年MCP、Skill、A2A接踵而至。

感觉像在追一部每周更新概念词典的连续剧,每个新词刚记住,下集又换了一批。

但这些词不是随机冒出来的。它们之间有一条明确的因果链------每一个新概念的出现,都在补前一个概念的短板。把这条线拉出来,所有"新词"就不再是零散的术语,而是同一个故事的不同章节。


起点:大模型很聪明,但有三个硬伤

2023年,LLM(大语言模型)把"AI能对话"这件事从实验室搬到了每个人的桌面上。GPT-4、Claude、Gemini 这些名字开始频繁出现在日常讨论里。

但大模型有三个它自己解决不了的问题:

知识有截止日期。 模型的"记忆力"来自训练数据,训练完成的那一刻之后发生的事,它一概不知。你问它"昨天发生了什么",它只能编一个看起来合理的回答------这就是所谓"幻觉"(hallucination)的来源之一。

只会说话,不会干活。 大模型能生成文本,但不能替你发邮件、查数据库、操作文件。它像一个只会写备忘录的助理------备忘录写得漂亮,但永远不会动手执行。

记不住上次聊了什么。 每次对话是独立的,上下文窗口(context window)有硬性上限。聊到第五轮,它可能已经忘了第一轮你说了什么。

这三个短板,直接催生了后面一连串新概念的诞生。


第一轮修补:给模型加"外挂"

RAG------让它能查资料再回答

RAG(检索增强生成,Retrieval-Augmented Generation)解决的是知识过期问题。原理不复杂:模型回答之前,先从外部知识库(文档、网页、数据库)里搜一遍相关内容,把搜到的信息塞进prompt里,再基于这些"新鲜资料"生成回答。

打个比方:大模型像个有扎实基础知识的毕业生,RAG给了它一个可以随时翻查的图书馆。遇到不确定的问题,先去图书馆查,而不是靠记忆硬编。

RAG很快成了企业应用AI的主流架构------因为企业的知识更新频率远高于模型训练频率,用RAG接入内部文档库比等模型重新训练现实得多。

Function Calling------让它能动手做事

Function Calling(函数调用)解决的是"只会说话不会干活"的问题。模型在对话中识别出需要执行某个操作时,调用预先定义好的函数------查天气、发邮件、读写数据库、调用其他API。

这跟"模型自己操作电脑"不是一回事。Function Calling更像给模型一份工具清单:它知道有哪些工具可以用、每个工具怎么用,但执行过程还是由外部系统完成,模型只负责判断"什么时候该用哪个工具"。

Fine-tuning / LoRA------让它更懂你的领域

微调(fine-tuning)解决的是通用模型在特定领域不够专业的问题。用领域数据继续训练模型,让它从"什么都懂一点"变成"某个方向特别强"。

LoRA(低秩适配)是微调的一种省钱方式------只更新模型参数的一小部分,效果接近全量微调,成本大幅降低。对大多数中小企业来说,LoRA已经够用。


第二轮跃迁:让它学会"思考"

Reasoning Model------先想再答

2024年底到2025年,OpenAI的o1/o3系列和DeepSeek R1把一个新概念推到了前台:reasoning model(推理模型)。

普通模型的回答方式是"看到问题→直接输出"。推理模型多了一步:看到问题→内部思考链→再输出。 这个内部思考过程是隐式的,用户看不到,但模型确实在"想"------把复杂问题拆成子步骤、验证中间结论、发现矛盾时重新规划。

这听起来像个小改动,实际影响很大。数学竞赛题(AIME)、编程挑战(SWE-bench)这类需要多步推导的场景,推理模型的得分飞跃式提升。DeepSeek R1在AIME 2026拿到91.67%,OpenAI o3在复杂数学证明上表现最强。

reasoning model的出现也解释了为什么2025年Agent开始真正实用------能规划多步骤任务的模型,才有资格驱动一个能自主行动的系统。


第三轮整合:从"聪明工具"到"自主行动"

Agent------自己规划、自己执行

Agent(智能体)不是新概念,但2025年才从概念走向实用。定义很简单:Agent = 在循环中运行工具以达成目标的LLM。

区别于直接调用模型问一个问题拿一个回答,Agent能:

  • 把一个复杂目标拆解成多个子步骤
  • 逐步执行,每一步判断结果是否符合预期
  • 不符合就调整计划,继续尝试
  • 直到目标完成才停止循环

最典型的落地场景是编码Agent。Claude Code 2025年底"安静发布",到2026年6月已经达到10亿美元年化收入------这证明Agent不只是概念,而是有真实付费需求的产品类别。

MCP------给工具接统一接口

Agent需要调用大量外部工具(搜索、文件操作、数据库查询),但每个AI应用都要为每个工具单独写适配层------碎片化严重,换个框架就得重写一遍。

MCP(模型上下文协议,Model Context Protocol)是Anthropic在2024年11月提出的开放协议,定义了AI模型与外部工具之间的标准通信方式。一个MCP Server写一次,所有支持MCP的Host(Claude、ChatGPT、VS Code、Cursor)都能直接用------不用逐个适配。

目前MCP已经获得主流AI开发工具的原生支持,成为事实标准。对普通用户来说,MCP的意义可能不太直观,但它的底层作用相当于"给AI工具生态装了一个USB-C统一接口"------工具开发者和AI应用开发者之间的对接成本大幅降低。

Skill------把能力打包复用

Skill(技能包)是把一组指令和工具权限封装成可复用的能力单元。跟MCP的区别:MCP是"外部工具的标准接口",Skill是"AI自身行为的操作手册"。MCP管的是"能调用什么",Skill管的是"怎么完成某个任务"。

对开发者来说,Skill的价值是减少重复------把高频操作流程封装一次,以后触发命令就能自动加载,不用每次手动写prompt描述步骤。


整条线拉出来看

把上面所有概念按出现时间和因果关系排成一条线:

yaml 复制代码
2023  LLM(大模型)登场
      ├─ 知识过期 → 2024  RAG(检索增强)
      ├─ 只能说话 → 2024  Function Calling(函数调用)
      ├─ 不够专业 → 2024  Fine-tuning / LoRA(微调)
      │
      多步推理能力突破 → 2025  Reasoning Model(推理模型)
      │
      推理能力 + 工具调用 + 规划 → 2025-2026  Agent(智能体)
      │                                  ├─ 工具对接碎片化 → 2026  MCP(统一工具协议)
      │                                  └─ 能力复用需求 → 2026  Skill(可复用技能包)

这条线的逻辑是:每一个新概念都在修补上一个阶段的缺口,修补本身又暴露出新的缺口,催生下一轮创新。

LLM知识过期 → RAG补上 → 但RAG只能查资料不能干活 → Function Calling补上 → 但通用模型在专业领域不够强 → Fine-tuning补上 → 但复杂任务需要多步推理 → Reasoning Model补上 → 推理能力有了,可以驱动自主行动了 → Agent出现 → Agent需要大量工具对接,碎片化严重 → MCP标准化 → Agent高频操作需要复用 → Skill封装。

不是随机冒出来的新词,是一环扣一环的演进。


还没补上的缺口

这条演进线走到了2026年6月,仍然有几个明显的缺口:

Agent之间的协作。 一个Agent能干活了,但多个Agent怎么分工协作?A2A(Agent-to-Agent协议)是Google在2025年提出的概念,目前还在早期阶段,没有形成像MCP那样的广泛共识。

长期记忆。 模型的上下文窗口越来越大(从4K到128K再到200万),但"窗口内记忆"和"真正的长期记忆"不是一回事。窗口满了就忘,跨会话的知识沉淀还没有成熟的标准化方案。

安全边界。 Agent能自主行动之后,"它能干的事"和"它应该被允许干的事"之间的边界变得模糊。提示注入攻击(prompt injection)导致数据泄露的风险,在Agent场景比在对话场景更严重------因为它不仅能生成文本,还能执行操作。

这些缺口就是下一个阶段新概念的孵化器。A2A可能成熟,长期记忆方案可能标准化,安全框架可能成为行业共识------也可能冒出完全不同的解决方案。但不管具体形式是什么,它们都沿着同一条因果线在走。


怎么用这条线帮自己理解新概念

以后再碰到一个陌生的AI术语,别急着查词典。先问自己一个问题:它在修补哪个缺口?

  • 如果是关于"知识"的 → 大概率在RAG这条线上演进(比如GraphRAG、Agentic RAG)
  • 如果是关于"行动"的 → 大概率在Agent/工具这条线上演进(比如MCP的新扩展、A2A)
  • 如果是关于"思考方式"的 → 大概率在reasoning这条线上演进(比如新的推理策略、规划框架)
  • 如果是关于"效率/成本"的 → 大概率在部署/微调这条线上演进(比如新的量化方法、蒸馏技术)

这样归类之后,新词就不再是"又一个要背的术语",而是"这条线上新加的一个节点"------你只需要理解它比前一个节点多了什么、补了什么,就能快速定位。


🔑

相关推荐
im_lanny1 小时前
Agent = Model + Harness:决定 AI 智能体上限的,往往不是模型而是“装具”
后端
笨鸟飞不快1 小时前
当规则比代码跑得快:我对用 LiteFlow 编排信贷业务的一点思考
后端·设计
苏三说技术1 小时前
干掉if...else,这个规则引擎真香!
后端
xiaoshuai10241 小时前
把权限校验从手写里解放出来:RBAC 注解 + 过滤器链的设计
后端
Csvn2 小时前
Python 开发技巧 · Python 上下文管理器 —— 从 with 到 contextlib 实战
后端
Csvn2 小时前
Python 开发技巧:functools 模块深入
后端
行者全栈架构师2 小时前
PolarDB + Spring Boot 实战:从自建MySQL到云原生数据库的零停机迁移
java·后端·架构
Gopher_HBo2 小时前
moby-容器对象与状态学习
后端
xiaoshuai10242 小时前
Controller 直连了数据库、模块缠成死结:用 ArchUnit 把架构钉死
后端