深入理解 AI 开发核心概念:Prompt、Agent、MCP、Skill 与 Tools
想要构建强大的 AI 应用,必须理解这些基础概念的边界与协作方式
前言
随着 AI 技术的快速发展,我们经常听到 Prompt、Agent、MCP、Skill 和 Tools 这些术语。它们之间有什么联系?又有什么本质区别?本文将带你深入了解这些概念。
1. Prompt(提示词)
定义
Prompt 是人类与大语言模型(LLM)之间的桥梁,是用自然语言描述的指令,告诉 AI 需要完成什么任务。
核心特点
- 自然语言形式:使用人类可读的文本描述
- 即时性:每次调用都需要提供
- 上下文依赖:包含任务描述、示例、约束条件等
- 一次性:不持久化存储
示例
请帮我分析这段代码的性能问题,并给出优化建议。
要求:
1. 使用简洁的语言
2. 指出具体的优化点
3. 给出代码示例
本质
Prompt 是临时的指令载体,它本身不具备执行能力,只是引导模型产生期望的输出。
2. Agent(智能体)
定义
Agent 是具有自主决策能力的 AI 实体,能够理解目标、规划步骤、调用工具,并最终完成任务。
核心特点
- 自主性:可以自主规划任务分解步骤
- 循环交互:与模型进行多轮对话
- 工具使用:能够调用外部工具获取信息
- 状态管理:维护任务执行过程中的状态
工作流程
用户输入 → 理解目标 → 规划步骤 → 执行行动 → 观察结果 → 判断是否完成
↑ ↓
└────────────── 未完成则循环 ──────────────────┘
本质
Agent 是能够思考和行动的 AI 系统,它使用 Prompt 与模型交互,但本身是一个更高层次的抽象。
3. Tools(工具)
定义
Tools 是 AI 可以调用的外部功能模块,通过函数调用的方式扩展模型的能力边界。
核心特点
- 可执行性:实际的代码函数或 API
- 输入输出明确:有清晰的参数定义和返回格式
- 功能聚焦:每个工具专注于单一功能
- 可组合性:多个工具可以组合使用
示例
json
{
"name": "search_web",
"description": "在互联网上搜索信息",
"parameters": {
"query": "搜索关键词",
"limit": 10
}
}
常见工具类型
| 工具类型 | 功能 | 示例 |
|---|---|---|
| 文件操作 | 读写、搜索文件 | Read, Write, Glob |
| 代码执行 | 运行代码、测试 | Bash, Python |
| 信息检索 | 搜索、查询 | WebSearch, Database |
| 数据处理 | 解析、转换 | JSON处理、正则表达式 |
本质
Tools 是可被 AI 调用的函数,是 Agent 实现目标的具体手段。
4. MCP(Model Context Protocol,模型上下文协议)
定义
MCP 是连接 AI 模型与外部数据源和应用的标准协议,由 Anthropic 提出,旨在解决 AI 系统与外部世界集成的难题。
核心特点
- 标准化:统一的接口规范
- 双向通信:模型可以主动请求,也可以被动接收
- 服务器-客户端架构:通过 MCP Server 提供资源
- 可扩展性:任何人都可以实现 MCP Server
MCP 可以做什么
typescript
// MCP Server 可以暴露:
- Resources(资源):文件、数据库记录、API 数据
- Tools(工具):可执行的功能
- Prompts(提示):预定义的提示模板
示例架构
┌─────────────┐ MCP Protocol ┌──────────────────┐
│ LLM App │ ←─────────────────→ │ MCP Server │
│ │ │ │
│ (Claude │ ├─ Resources │ - Git Server │
│ Code) │ ├─ Tools │ - Database MCP │
│ │ └─ Prompts │ - Slack MCP │
└─────────────┘ └──────────────────┘
本质
MCP 是标准化的集成协议,让不同应用能够以统一方式与 AI 模型交互。
5. Skill(技能)
定义
Skill 是封装好的、可复用的任务能力,通常由一系列配置好的 Prompt、Tools 和 Agent 行为组成。
核心特点
- 可复用性:一次定义,多次使用
- 封装性:隐藏内部复杂度
- 可调用:通过命令或 API 触发
- 专业化:每个技能专注特定领域
示例
bash
# 用户可以直接调用
/commit # 自动创建 Git 提交
/review-pr 123 # 审查 Pull Request
/pdf document.pdf # 分析 PDF 文档
内部结构(概念性)
Skill: /commit
├── Prompt 模板: "分析 git diff 并生成提交信息"
├── Tools: [git status, git diff, git commit]
├── Agent 逻辑: 查看变更 → 生成信息 → 确认 → 提交
└── 配置: 提交信息风格、是否跳过 hooks 等
本质
Skill 是用户可见的能力抽象,是底层复杂能力的简洁封装。
概念对比与关系
层次关系
┌─────────────────────────────────────────────────────┐
│ Skill │ ← 用户直接调用
│ (能力封装:/commit, /review, /test) │
├─────────────────────────────────────────────────────┤
│ Agent │ ← 自主决策系统
│ (思考+行动:规划、调用工具、循环) │
├─────────────────────────────────────────────────────┤
│ Prompt + Tools │ ← 基础构建块
│ (Prompt: 指令 | Tools: 可调用功能) │
├─────────────────────────────────────────────────────┤
│ MCP │ ← 集成协议
│ (标准化接口连接外部世界) │
└─────────────────────────────────────────────────────┘
关键区别
| 概念 | 本质 | 生命周期 | 用户交互 |
|---|---|---|---|
| Prompt | 文本指令 | 临时、一次性 | 不可见(内部) |
| Agent | 决策系统 | 会话级别 | 部分可见 |
| Tools | 可调用函数 | 持久存在 | 通过 Agent 调用 |
| MCP | 通信协议 | 系统级别 | 不可见(基础设施) |
| Skill | 能力封装 | 持久可复用 | 直接调用 |
类比理解
| AI 概念 | 类比 | 说明 |
|---|---|---|
| Prompt | 任务说明 | 告诉助手要做什么 |
| Agent | 智能助手 | 能理解并自主完成任务 |
| Tools | 工具箱里的工具 | 助手可以使用的具体工具 |
| MCP | 万能插座标准 | 让不同工具能统一接入 |
| Skill | 预设的工作流 | 一键调用的专业服务 |
实际应用场景
场景 1:代码审查 Skill
用户调用: /review-pr 123
↓ Skill 触发
├── Agent 启动
│ ├── Prompt: "审查这个 PR 的代码质量"
│ ├── 调用 Tools:
│ │ ├── gh pr view 123 (获取 PR 信息)
│ │ ├── gh pr diff 123 (获取代码变更)
│ │ └── analyze_code() (分析代码)
│ └── 循环交互直到完成
│
└── 返回审查报告
(后台可能通过 MCP 连接到 Git 服务器)
场景 2:文档搜索系统
┌──────────────────┐
│ 用户查询 │
└────────┬─────────┘
│
↓
┌──────────────────────────────────────────┐
│ Agent 理解需求 │
│ "查找关于 MCP 的文档" │
└────────┬─────────────────────────────────┘
│
↓
┌──────────────────────────────────────────┐
│ 调用 MCP Server │
│ ├─ mcp://github (仓库文件) │
│ ├─ mcp://notion (知识库) │
│ └─ mcp://slack (团队讨论) │
└────────┬─────────────────────────────────┘
│
↓
┌──────────────────────────────────────────┐
│ 使用 Tools 处理数据 │
│ ├─ search_files() │
│ ├─ parse_markdown() │
│ └── summarize_content() │
└────────┬─────────────────────────────────┘
│
↓
返回整合答案
总结
- Prompt 是基础------与模型对话的方式
- Agent 是大脑------能够自主思考和行动
- Tools 是双手------执行具体任务的能力
- MCP 是桥梁------连接 AI 与外部世界
- Skill 是服务------用户可直接使用的能力
理解这些概念的边界和协作方式,是构建优秀 AI 应用的关键。它们各司其职,相互配合,共同构成了现代 AI 系统的基础架构。
参考资源
作者注:本文以概念理解为主,实际应用中这些边界可能更灵活。重要的是理解它们解决问题的层次和方式。
最后更新:2026年3月