AI 核心概念之差异讲解
------从「不能干活」到「像人一样干活」
一、AI 概念发展主线(先记住这条线)
LLM → Agent → MCP → Skill
每一步,都是为了解决「上一步做不到的事」
二、LLM(Large Language Model)
1️⃣ 解决了什么问题?
让机器"会思考、会表达"
2️⃣ 本质是什么?
- 基于概率预测下一个 token
- 类似:高级成语接龙 + 统计推断
3️⃣ 能做什么?
- 对话
- 写文章
- 生成代码
- 推理(仅限上下文内)
4️⃣ 核心局限(重点)
- ❌ 不能读文件
- ❌ 不能联网获取新信息
- ❌ 不能执行命令
- ❌ 不能主动行动
📌 结论:
LLM 只能"想",不能"做"
三、Agent(智能体)
1️⃣ 为什么要有 Agent?
因为 LLM 想得再好,也什么都干不了
2️⃣ Agent 解决了什么问题?
让 AI 能"动起来",替 LLM 干活
3️⃣ Agent 的本质(一句话)
Agent = LLM + 执行能力 + 流程控制
4️⃣ Agent 的核心循环(必须会)
1. 收集信息 → 发送给 LLM
2. LLM 生成"下一步指令"
3. Agent 执行指令 → 结果再发给 LLM
(循环,直到问题解决)
5️⃣ Agent 能做到什么?
- 读文件
- 搜索信息
- 执行命令
- 多轮操作
- 维护状态(历史上下文)
📌 结论:
Agent 让 AI 从"只会想",变成"能干活"
四、为什么 Agent 还不够?(关键转折点)
问题出现了:
Agent 只能使用"提前写死的工具"
例如:
- read_file
- search
- run_command
现实世界的问题是:
- 数据不全在公网
- 大量数据在:
- 企业内网
- OA / CRM / 数据库
- 私有系统
👉 Agent 根本不知道这些系统怎么访问
五、MCP(Model Context Protocol)
1️⃣ MCP 出现是为了解决什么问题?
Agent 想干活,但进不了"你的系统"
2️⃣ MCP 的本质(通俗版)
MCP = 给 Agent 接外部系统用的"统一接口标准"
它解决的不是"聪不聪明",而是:
- 能不能接
- 怎么接
- 用什么规范接
3️⃣ 没有 MCP 会怎样?
- 每接一个系统:
- 单独写工具
- 单独写调用逻辑
- 单独适配 Agent
结果:
- ❌ 成本高
- ❌ 不通用
- ❌ 难维护
4️⃣ 有 MCP 之后
- 系统只要遵守 MCP
- Agent 就能直接用
- 不关心系统内部细节
📌 类比理解(非常重要):
| MCP 类比 | 含义 |
|---|---|
| USB 接口 | 统一外设接入 |
| 驱动规范 | 软件与硬件解耦 |
| REST API | 系统标准通信方式 |
📌 结论:
MCP 解决的是"Agent 怎么进入真实世界"的问题
六、为什么 MCP + Agent 还不够?
新问题出现:
Agent 每次都要"从 0 开始想流程"
例如:
- 修 Java 错误
- 查日志
- 排查故障
每次都:
- 临时推理
- 临时组合步骤
结果:
- ❌ 慢
- ❌ 不稳定
- ❌ 同样问题,表现不一致
七、Skill(技能)
1️⃣ Skill 出现是为了解决什么问题?
"这类问题我已经处理过很多次了,能不能别每次都重新想?"
2️⃣ Skill 的本质(通俗版)
Skill = 把"成熟套路"封装成可复用能力
3️⃣ Skill 是什么?
- 一组 固定目标 + 固定流程 + 固定工具组合
- 类似:
- "Java 编译错误排查 Skill"
- "数据库巡检 Skill"
- "安全扫描 Skill"
4️⃣ Skill ≠ Tool(重要区分)
| 对比项 | Tool | Skill |
|---|---|---|
| 粒度 | 原子操作 | 组合流程 |
| 是否有逻辑 | 否 | 是 |
| 是否复用 | 低 | 高 |
📌 结论:
Skill 让 Agent 从"临场发挥",变成"熟练工"
八、四个概念的终极关系(强记忆版)
LLM :负责想
Agent :负责跑流程
MCP :负责接系统
Skill :负责快而稳
九、一眼明白总结(最后记这段)
- LLM:只有脑子
- Agent:有手有脚
- MCP:有钥匙、有门
- Skill:有肌肉记忆
AI 的进化,本质就是:
从"会说话",到"能干活",再到"像人一样干活"