深入理解 AI 开发核心概念：Prompt、Agent、MCP、Skill 与 Tools

想要构建强大的 AI 应用，必须理解这些基础概念的边界与协作方式

前言

随着 AI 技术的快速发展，我们经常听到 Prompt、Agent、MCP、Skill 和 Tools 这些术语。它们之间有什么联系？又有什么本质区别？本文将带你深入了解这些概念。

1. Prompt（提示词）

定义

Prompt 是人类与大语言模型（LLM）之间的桥梁，是用自然语言描述的指令，告诉 AI 需要完成什么任务。

核心特点

自然语言形式：使用人类可读的文本描述
即时性：每次调用都需要提供
上下文依赖：包含任务描述、示例、约束条件等
一次性：不持久化存储

示例

复制代码

请帮我分析这段代码的性能问题，并给出优化建议。
要求：
1. 使用简洁的语言
2. 指出具体的优化点
3. 给出代码示例

本质

Prompt 是临时的指令载体，它本身不具备执行能力，只是引导模型产生期望的输出。

2. Agent（智能体）

定义

Agent 是具有自主决策能力的 AI 实体，能够理解目标、规划步骤、调用工具，并最终完成任务。

核心特点

自主性：可以自主规划任务分解步骤
循环交互：与模型进行多轮对话
工具使用：能够调用外部工具获取信息
状态管理：维护任务执行过程中的状态

工作流程

复制代码

用户输入 → 理解目标 → 规划步骤 → 执行行动 → 观察结果 → 判断是否完成
               ↑                                           ↓
               └────────────── 未完成则循环 ──────────────────┘

本质

Agent 是能够思考和行动的 AI 系统，它使用 Prompt 与模型交互，但本身是一个更高层次的抽象。

3. Tools（工具）

定义

Tools 是 AI 可以调用的外部功能模块，通过函数调用的方式扩展模型的能力边界。

核心特点

可执行性：实际的代码函数或 API
输入输出明确：有清晰的参数定义和返回格式
功能聚焦：每个工具专注于单一功能
可组合性：多个工具可以组合使用

示例

json 复制代码

{
  "name": "search_web",
  "description": "在互联网上搜索信息",
  "parameters": {
    "query": "搜索关键词",
    "limit": 10
  }
}

常见工具类型

工具类型	功能	示例
文件操作	读写、搜索文件	Read, Write, Glob
代码执行	运行代码、测试	Bash, Python
信息检索	搜索、查询	WebSearch, Database
数据处理	解析、转换	JSON处理、正则表达式

本质

Tools 是可被 AI 调用的函数，是 Agent 实现目标的具体手段。

4. MCP（Model Context Protocol，模型上下文协议）

定义

MCP 是连接 AI 模型与外部数据源和应用的标准协议，由 Anthropic 提出，旨在解决 AI 系统与外部世界集成的难题。

核心特点

标准化：统一的接口规范
双向通信：模型可以主动请求，也可以被动接收
服务器-客户端架构：通过 MCP Server 提供资源
可扩展性：任何人都可以实现 MCP Server

MCP 可以做什么

typescript 复制代码

// MCP Server 可以暴露：
- Resources（资源）：文件、数据库记录、API 数据
- Tools（工具）：可执行的功能
- Prompts（提示）：预定义的提示模板

示例架构

复制代码

┌─────────────┐     MCP Protocol      ┌──────────────────┐
│   LLM App   │ ←─────────────────→  │   MCP Server     │
│             │                       │                  │
│  (Claude    │    ├─ Resources       │  - Git Server    │
│   Code)     │    ├─ Tools           │  - Database MCP  │
│             │    └─ Prompts         │  - Slack MCP     │
└─────────────┘                       └──────────────────┘

本质

MCP 是标准化的集成协议，让不同应用能够以统一方式与 AI 模型交互。

5. Skill（技能）

定义

Skill 是封装好的、可复用的任务能力，通常由一系列配置好的 Prompt、Tools 和 Agent 行为组成。

核心特点

可复用性：一次定义，多次使用
封装性：隐藏内部复杂度
可调用：通过命令或 API 触发
专业化：每个技能专注特定领域

示例

bash 复制代码

# 用户可以直接调用
/commit          # 自动创建 Git 提交
/review-pr 123   # 审查 Pull Request
/pdf document.pdf # 分析 PDF 文档

内部结构（概念性）

复制代码

Skill: /commit
├── Prompt 模板: "分析 git diff 并生成提交信息"
├── Tools: [git status, git diff, git commit]
├── Agent 逻辑: 查看变更 → 生成信息 → 确认 → 提交
└── 配置: 提交信息风格、是否跳过 hooks 等

本质

Skill 是用户可见的能力抽象，是底层复杂能力的简洁封装。

概念对比与关系

层次关系

复制代码

┌─────────────────────────────────────────────────────┐
│                    Skill                            │  ← 用户直接调用
│  （能力封装：/commit, /review, /test）              │
├─────────────────────────────────────────────────────┤
│                    Agent                            │  ← 自主决策系统
│  （思考+行动：规划、调用工具、循环）                 │
├─────────────────────────────────────────────────────┤
│            Prompt + Tools                           │  ← 基础构建块
│  （Prompt: 指令 | Tools: 可调用功能）                │
├─────────────────────────────────────────────────────┤
│                    MCP                              │  ← 集成协议
│  （标准化接口连接外部世界）                          │
└─────────────────────────────────────────────────────┘

关键区别

概念	本质	生命周期	用户交互
Prompt	文本指令	临时、一次性	不可见（内部）
Agent	决策系统	会话级别	部分可见
Tools	可调用函数	持久存在	通过 Agent 调用
MCP	通信协议	系统级别	不可见（基础设施）
Skill	能力封装	持久可复用	直接调用

类比理解

AI 概念	类比	说明
Prompt	任务说明	告诉助手要做什么
Agent	智能助手	能理解并自主完成任务
Tools	工具箱里的工具	助手可以使用的具体工具
MCP	万能插座标准	让不同工具能统一接入
Skill	预设的工作流	一键调用的专业服务

实际应用场景

场景 1：代码审查 Skill

复制代码

用户调用: /review-pr 123

↓ Skill 触发

├── Agent 启动
│   ├── Prompt: "审查这个 PR 的代码质量"
│   ├── 调用 Tools:
│   │   ├── gh pr view 123      (获取 PR 信息)
│   │   ├── gh pr diff 123      (获取代码变更)
│   │   └── analyze_code()      (分析代码)
│   └── 循环交互直到完成
│
└── 返回审查报告

(后台可能通过 MCP 连接到 Git 服务器)

场景 2：文档搜索系统

复制代码

┌──────────────────┐
│   用户查询       │
└────────┬─────────┘
         │
         ↓
┌──────────────────────────────────────────┐
│  Agent 理解需求                           │
│  "查找关于 MCP 的文档"                    │
└────────┬─────────────────────────────────┘
         │
         ↓
┌──────────────────────────────────────────┐
│  调用 MCP Server                         │
│  ├─ mcp://github (仓库文件)              │
│  ├─ mcp://notion (知识库)                │
│  └─ mcp://slack (团队讨论)               │
└────────┬─────────────────────────────────┘
         │
         ↓
┌──────────────────────────────────────────┐
│  使用 Tools 处理数据                      │
│  ├─ search_files()                       │
│  ├─ parse_markdown()                     │
│  └── summarize_content()                 │
└────────┬─────────────────────────────────┘
         │
         ↓
    返回整合答案

总结

Prompt 是基础------与模型对话的方式
Agent 是大脑------能够自主思考和行动
Tools 是双手------执行具体任务的能力
MCP 是桥梁------连接 AI 与外部世界
Skill 是服务------用户可直接使用的能力

理解这些概念的边界和协作方式，是构建优秀 AI 应用的关键。它们各司其职，相互配合，共同构成了现代 AI 系统的基础架构。

参考资源

作者注：本文以概念理解为主，实际应用中这些边界可能更灵活。重要的是理解它们解决问题的层次和方式。

最后更新：2026年3月