10分钟讲清楚 Prompt、Agent、MCP 是什么

10分钟讲清楚 Prompt、Agent、MCP 是什么

视频整理自 B站 UP主「隔壁的程序员老王」同名视频(BV1aeLqzUE6L)

播放量 77万 · 点赞 4.4万 · 收藏 5.2万 · 发布于 2025-05-01

引言:从「跟AI聊天」到「让AI干活」

你是不是也有这样的困惑------明明都在说 AI、大模型、ChatGPT,但一听到 Prompt、Agent、MCP、Function Calling 这些名词就头大?

别急,这不是你的问题。这些概念确实容易混在一起,因为它们都是围绕「怎么让 AI 更好用」这个核心目标展开的。今天就花 10 分钟,把它们彻底理清楚。

理解这些概念,核心就一句话:

你跟 AI 说一句话叫 Prompt;让 AI 自己说好几句话、做好几件事叫 Agent;让 AI 能调用外部工具叫 MCP。

一、Prompt:提示词------你和 AI 之间的语言

1.1 什么是 Prompt?

Prompt 就是你发给大模型的那段文字

最简单的 Prompt 就是一个问题:「什么是黑洞?」「帮我写一封请假邮件。」

高级一点的 Prompt 包含:角色设定 + 背景信息 + 具体任务 + 输出格式,比如:

复制代码
你是一位资深的 Python 工程师(角色)。
我有一个 Flask 后端项目,需要添加用户认证功能(背景)。
请帮我设计 JWT Token 的签发和验证流程(任务),
用 Markdown 格式输出,包含代码示例(格式)。

1.2 Prompt 的本质

Prompt 的本质是用自然语言「编程」

传统编程:你写代码告诉计算机一步一步怎么做

Prompt 工程:你用自然语言告诉大模型你想要什么结果,让它自己想办法。

1.3 Prompt 的局限性

Prompt 有一个硬伤:一次交互,一个任务

你问一个问题,它回答一次。对话结束。如果你想让它完成一系列步骤------比如先搜索信息、再分析数据、再生成报告------光靠 Prompt 做不到。

这就是 Agent 登场的时刻。

二、Agent:智能体------让 AI 自己干活

2.1 什么是 Agent?

Agent(智能体)就是把 大模型 + 工具 + 自主决策 结合在一起。

如果 Prompt 是「你给 AI 布置一个任务,它做一次」,那 Agent 就是「你给 AI 布置一个任务,它自己规划步骤、自己调用工具、自己判断是否完成」。

2.2 Agent 的核心组件

一个典型的 Agent 包含四个部分:

组件 作用 类比
LLM(大模型) 大脑,负责理解和推理 人的大脑
Memory(记忆) 存储上下文和历史信息 人的笔记本
Tools(工具) 调用外部能力(搜索、计算、读写文件等) 人的双手
Planning(规划) 把复杂任务拆解为子任务 人的计划能力

2.3 Agent 的工作流程

举个例子,你说:「帮我调研一下 2025 年新能源汽车市场,写一份报告。」

一个 Agent 会这样做:

  1. 规划(Planning):把任务拆解为几步------搜索市场数据 → 整理关键信息 → 分析趋势 → 生成报告
  2. 执行(Action):调用搜索工具获取数据,调用计算工具处理数字
  3. 观察(Observation):检查搜索结果是否有用,数据是否充分
  4. 迭代(Iteration):如果信息不够,再去搜索;如果足够,开始写报告
  5. 输出(Output):生成最终报告,交给你

这个过程是自主循环的,不需要你一步步指导。这就是 Agent 和简单 Prompt 的最大区别。

2.4 Agent 的关键能力:Function Calling

Agent 能调用工具,底层靠的就是 Function Calling(函数调用)

Function Calling 让大模型不仅能「说」,还能「做」。大模型输出一段结构化的指令:「请帮我调用 search_web 函数,参数是 "2025新能源汽车市场"。」 Agent 框架收到后执行这个调用,把结果返回给大模型,大模型继续推理。

这是 Agent 的「手」------没有 Function Calling,Agent 就只是一个会说话的大脑。

三、MCP:模型上下文协议------AI 的「USB 接口」

3.1 什么是 MCP?

MCP 全称 Model Context Protocol(模型上下文协议),由 Anthropic(Claude 的开发公司)在 2024 年底开源提出。

一句话解释:MCP 是 AI 世界的 USB 接口标准

3.2 为什么需要 MCP?

在 MCP 出现之前,每个 AI 工具(ChatGPT、Claude、Cursor、Windsurf......)都有自己的一套工具接入方式。你想让 Claude 能访问你的文件系统?需要写一套代码。想让 ChatGPT 也能?再写一套。

这就像以前每个手机品牌充电接口都不一样,换一个手机就要换一根充电线。

MCP 就是 AI 领域的 USB-C 接口

  • 工具开发者只需要写一次 MCP Server
  • 所有支持 MCP 协议的 AI 客户端都可以直接使用
  • 不需要为每个 AI 应用单独适配

3.3 MCP 的架构

MCP 采用 Client-Server 架构:

复制代码
AI 客户端 (MCP Client)  ←──标准协议──→  工具服务 (MCP Server)
     │                                          │
  Claude / Cursor / ...                     文件系统 / 数据库 / API / ...
  • MCP Client:内嵌在 AI 应用中(如 Claude Desktop、Cursor IDE),负责管理连接
  • MCP Server:独立的进程,提供具体能力(比如文件读写、数据库查询、GitHub 操作)
  • 协议:双方通过 JSON-RPC 2.0 通信,有统一的标准格式

3.4 MCP 三大核心能力

MCP Server 可以向 AI 暴露三种能力:

  1. Tools(工具):AI 可以调用的函数。比如「搜索文件」「执行 SQL」「发送邮件」
  2. Resources(资源):AI 可以读取的数据。比如文件内容、数据库记录、API 返回值
  3. Prompts(提示模板):预定义的提示词模板,用户可以直接选用

3.5 MCP 的实际应用

举个例子,你安装了一个「GitHub MCP Server」,那么任何支持 MCP 的 AI 客户端都能:

  • 读取你的仓库代码
  • 创建 Issue
  • 提交 Pull Request
  • 查看 CI/CD 状态

再装一个「数据库 MCP Server」,AI 就能直接查询你的数据库。

一个 Server,到处可用。这就是 MCP 的价值。

四、三者的关系:一张图看懂

复制代码
┌─────────────────────────────────────────────────────┐
│                    Agent(智能体)                      │
│                                                      │
│   ┌──────────┐    ┌───────────┐    ┌──────────────┐  │
│   │  LLM 大脑  │◄──►│  记忆存储   │    │   规划引擎    │  │
│   └──────────┘    └───────────┘    └──────────────┘  │
│         │                                          │
│         │ Function Calling                         │
│         ▼                                          │
│   ┌──────────────────────────────────────────┐      │
│   │          MCP 协议层                        │      │
│   │   (统一标准,即插即用)                       │      │
│   └──────────┬───────┬───────┬───────────────┘      │
│              │       │       │                       │
│         ┌────┴──┐ ┌──┴───┐ ┌┴────────┐             │
│         │文件系统│ │数据库 │ │ GitHub  │ ...         │
│         │Server │ │Server│ │ Server  │             │
│         └───────┘ └──────┘ └─────────┘             │
└─────────────────────────────────────────────────────┘

用户 → Prompt → Agent 接收任务 → 通过 MCP 调用工具 → 完成任务 → 返回结果

简单总结:

概念 一句话 打比方
Prompt 你跟 AI 说的话 你给助手下的指令
Agent 能自主完成任务的 AI 能独立干活的员工
MCP AI 连接外部工具的标准协议 万能 USB 接口

五、从理解到实践

如果你只是想用好 AI

  • 学好 Prompt Engineering(提示词工程)就够了
  • 掌握角色设定、上下文、分步引导等技巧
  • 推荐:Claude 的官方提示词指南

如果你想让 AI 自动干活

  • 需要理解 Agent 的概念和工作原理
  • 选一个 Agent 框架开始实践:LangChain、AutoGen、CrewAI、OpenClaw 等
  • 关键是学会定义工具(Function Calling)

如果你想开发 AI 工具

  • MCP 是目前最值得投入的方向
  • 写一个 MCP Server,所有 AI 应用都能用你的工具
  • Anthropic 提供了完整的 SDK(Python / TypeScript)

六、展望

这三个概念代表了 AI 应用发展的三个阶段:

  1. Prompt 时代:人类一句话,AI 一段回答(2022-2023)
  2. Agent 时代:人类一个目标,AI 自主执行(2024-2025)
  3. MCP 时代:AI 工具标准化,生态互通(2025+)

我们正处在从 Agent 到 MCP 的过渡期。未来的 AI 工具生态会像手机 App 生态一样繁荣------而 MCP 就是那个「App Store」的基础设施。

理解了这三个概念,你就理解了当前 AI 应用开发的核心脉络。

本文根据 B站 UP主「隔壁的程序员老王」视频内容整理改编。原视频播放量 77万+,属于"10分钟吃透AI"系列合集。

相关推荐
波动几何10 小时前
Capability Pipeline OS - 通用能力管线操作系统
人工智能
F2的AI学习笔记10 小时前
下一代键盘,可能戴在手腕上
人工智能
wyg_03111310 小时前
codex features
人工智能
小程故事多_8010 小时前
Agent Loop 核心突破,上下文压缩四大流派,重新定义窗口资源利用率
java·开发语言·人工智能
小小工匠10 小时前
Spring AI RAG - 09 AI 绘图 ImageModel 集成
人工智能·spring
渣渣苏10 小时前
硬核拆解 HNSW:亿级向量如何实现毫秒级召回?(上篇)
人工智能·算法·支持向量机·ai·向量数据库·hnsw·智能体
CCC:CarCrazeCurator10 小时前
DriveGen: 基于扩散 Transformer 的驾驶场景视频生成器
人工智能·机器学习·自动驾驶
AI创界者10 小时前
HiDream-O1 整合包发布:解压即用!原生统一图像生成模型,彻底告别 VAE 与独立文本编码器
人工智能
十铭忘10 小时前
个人思考4——价值驱动的重要性
人工智能