深入理解 AI 开发核心概念:Prompt、Agent、MCP、Skill 与 Tools

深入理解 AI 开发核心概念:Prompt、Agent、MCP、Skill 与 Tools

想要构建强大的 AI 应用,必须理解这些基础概念的边界与协作方式


前言

随着 AI 技术的快速发展,我们经常听到 Prompt、Agent、MCP、Skill 和 Tools 这些术语。它们之间有什么联系?又有什么本质区别?本文将带你深入了解这些概念。


1. Prompt(提示词)

定义

Prompt 是人类与大语言模型(LLM)之间的桥梁,是用自然语言描述的指令,告诉 AI 需要完成什么任务。

核心特点

  • 自然语言形式:使用人类可读的文本描述
  • 即时性:每次调用都需要提供
  • 上下文依赖:包含任务描述、示例、约束条件等
  • 一次性:不持久化存储

示例

复制代码
请帮我分析这段代码的性能问题,并给出优化建议。
要求:
1. 使用简洁的语言
2. 指出具体的优化点
3. 给出代码示例

本质

Prompt 是临时的指令载体,它本身不具备执行能力,只是引导模型产生期望的输出。


2. Agent(智能体)

定义

Agent 是具有自主决策能力的 AI 实体,能够理解目标、规划步骤、调用工具,并最终完成任务。

核心特点

  • 自主性:可以自主规划任务分解步骤
  • 循环交互:与模型进行多轮对话
  • 工具使用:能够调用外部工具获取信息
  • 状态管理:维护任务执行过程中的状态

工作流程

复制代码
用户输入 → 理解目标 → 规划步骤 → 执行行动 → 观察结果 → 判断是否完成
               ↑                                           ↓
               └────────────── 未完成则循环 ──────────────────┘

本质

Agent 是能够思考和行动的 AI 系统,它使用 Prompt 与模型交互,但本身是一个更高层次的抽象。


3. Tools(工具)

定义

Tools 是 AI 可以调用的外部功能模块,通过函数调用的方式扩展模型的能力边界。

核心特点

  • 可执行性:实际的代码函数或 API
  • 输入输出明确:有清晰的参数定义和返回格式
  • 功能聚焦:每个工具专注于单一功能
  • 可组合性:多个工具可以组合使用

示例

json 复制代码
{
  "name": "search_web",
  "description": "在互联网上搜索信息",
  "parameters": {
    "query": "搜索关键词",
    "limit": 10
  }
}

常见工具类型

工具类型 功能 示例
文件操作 读写、搜索文件 Read, Write, Glob
代码执行 运行代码、测试 Bash, Python
信息检索 搜索、查询 WebSearch, Database
数据处理 解析、转换 JSON处理、正则表达式

本质

Tools 是可被 AI 调用的函数,是 Agent 实现目标的具体手段。


4. MCP(Model Context Protocol,模型上下文协议)

定义

MCP 是连接 AI 模型与外部数据源和应用的标准协议,由 Anthropic 提出,旨在解决 AI 系统与外部世界集成的难题。

核心特点

  • 标准化:统一的接口规范
  • 双向通信:模型可以主动请求,也可以被动接收
  • 服务器-客户端架构:通过 MCP Server 提供资源
  • 可扩展性:任何人都可以实现 MCP Server

MCP 可以做什么

typescript 复制代码
// MCP Server 可以暴露:
- Resources(资源):文件、数据库记录、API 数据
- Tools(工具):可执行的功能
- Prompts(提示):预定义的提示模板

示例架构

复制代码
┌─────────────┐     MCP Protocol      ┌──────────────────┐
│   LLM App   │ ←─────────────────→  │   MCP Server     │
│             │                       │                  │
│  (Claude    │    ├─ Resources       │  - Git Server    │
│   Code)     │    ├─ Tools           │  - Database MCP  │
│             │    └─ Prompts         │  - Slack MCP     │
└─────────────┘                       └──────────────────┘

本质

MCP 是标准化的集成协议,让不同应用能够以统一方式与 AI 模型交互。


5. Skill(技能)

定义

Skill 是封装好的、可复用的任务能力,通常由一系列配置好的 Prompt、Tools 和 Agent 行为组成。

核心特点

  • 可复用性:一次定义,多次使用
  • 封装性:隐藏内部复杂度
  • 可调用:通过命令或 API 触发
  • 专业化:每个技能专注特定领域

示例

bash 复制代码
# 用户可以直接调用
/commit          # 自动创建 Git 提交
/review-pr 123   # 审查 Pull Request
/pdf document.pdf # 分析 PDF 文档

内部结构(概念性)

复制代码
Skill: /commit
├── Prompt 模板: "分析 git diff 并生成提交信息"
├── Tools: [git status, git diff, git commit]
├── Agent 逻辑: 查看变更 → 生成信息 → 确认 → 提交
└── 配置: 提交信息风格、是否跳过 hooks 等

本质

Skill 是用户可见的能力抽象,是底层复杂能力的简洁封装。


概念对比与关系

层次关系

复制代码
┌─────────────────────────────────────────────────────┐
│                    Skill                            │  ← 用户直接调用
│  (能力封装:/commit, /review, /test)              │
├─────────────────────────────────────────────────────┤
│                    Agent                            │  ← 自主决策系统
│  (思考+行动:规划、调用工具、循环)                 │
├─────────────────────────────────────────────────────┤
│            Prompt + Tools                           │  ← 基础构建块
│  (Prompt: 指令 | Tools: 可调用功能)                │
├─────────────────────────────────────────────────────┤
│                    MCP                              │  ← 集成协议
│  (标准化接口连接外部世界)                          │
└─────────────────────────────────────────────────────┘

关键区别

概念 本质 生命周期 用户交互
Prompt 文本指令 临时、一次性 不可见(内部)
Agent 决策系统 会话级别 部分可见
Tools 可调用函数 持久存在 通过 Agent 调用
MCP 通信协议 系统级别 不可见(基础设施)
Skill 能力封装 持久可复用 直接调用

类比理解

AI 概念 类比 说明
Prompt 任务说明 告诉助手要做什么
Agent 智能助手 能理解并自主完成任务
Tools 工具箱里的工具 助手可以使用的具体工具
MCP 万能插座标准 让不同工具能统一接入
Skill 预设的工作流 一键调用的专业服务

实际应用场景

场景 1:代码审查 Skill

复制代码
用户调用: /review-pr 123

↓ Skill 触发

├── Agent 启动
│   ├── Prompt: "审查这个 PR 的代码质量"
│   ├── 调用 Tools:
│   │   ├── gh pr view 123      (获取 PR 信息)
│   │   ├── gh pr diff 123      (获取代码变更)
│   │   └── analyze_code()      (分析代码)
│   └── 循环交互直到完成
│
└── 返回审查报告

(后台可能通过 MCP 连接到 Git 服务器)

场景 2:文档搜索系统

复制代码
┌──────────────────┐
│   用户查询       │
└────────┬─────────┘
         │
         ↓
┌──────────────────────────────────────────┐
│  Agent 理解需求                           │
│  "查找关于 MCP 的文档"                    │
└────────┬─────────────────────────────────┘
         │
         ↓
┌──────────────────────────────────────────┐
│  调用 MCP Server                         │
│  ├─ mcp://github (仓库文件)              │
│  ├─ mcp://notion (知识库)                │
│  └─ mcp://slack (团队讨论)               │
└────────┬─────────────────────────────────┘
         │
         ↓
┌──────────────────────────────────────────┐
│  使用 Tools 处理数据                      │
│  ├─ search_files()                       │
│  ├─ parse_markdown()                     │
│  └── summarize_content()                 │
└────────┬─────────────────────────────────┘
         │
         ↓
    返回整合答案

总结

  1. Prompt 是基础------与模型对话的方式
  2. Agent 是大脑------能够自主思考和行动
  3. Tools 是双手------执行具体任务的能力
  4. MCP 是桥梁------连接 AI 与外部世界
  5. Skill 是服务------用户可直接使用的能力

理解这些概念的边界和协作方式,是构建优秀 AI 应用的关键。它们各司其职,相互配合,共同构成了现代 AI 系统的基础架构。


参考资源


作者注:本文以概念理解为主,实际应用中这些边界可能更灵活。重要的是理解它们解决问题的层次和方式。

最后更新:2026年3月

相关推荐
前端小张同学12 分钟前
有了AI大家的日常是轻松了还是更焦虑了呢?
人工智能·程序员·ai编程
快手技术14 分钟前
KAT-Coder-Pro V2:玩转龙虾,吃透美学
人工智能
新缸中之脑38 分钟前
AI工程师成长路线图 (2026)
人工智能
商业数据派38 分钟前
快手估值重构的“隐藏彩蛋”
大数据·人工智能·重构
新缸中之脑41 分钟前
你的智能体技术栈中缺失的层
大数据·人工智能·数据挖掘
呆呆敲代码的小Y1 小时前
UnityMCP+Claude+VSCode,构建最强AI游戏开发环境
人工智能·vscode·游戏·unity·游戏引擎·u3d·mcp
balmtv1 小时前
Claude 3.5镜像深度推理实战:用AI破解复杂逻辑谜题与数学证明
人工智能
BPM6661 小时前
2026 AI流程管理软件选型:从BPM到iBPM,如何构建可分析、可优化、可执行的流程平台
人工智能
wggmrlee2 小时前
AI技术架构全局视角
人工智能·架构
peachSoda72 小时前
前端想转AI全栈-初步练习记录
前端·人工智能