什么是Agent?
以我们的豆包为例,最典型的例子就是AI对话,最基础的就是聊天式的问答的场景
我(用户) 向大模型(AI)提问,豆包(Agent)是用户和大模型之间的桥梁

Prompt
我们初步的将Prompt分为System Prompt和User Prompt
像我们正常的跟AI大模型对话,在没有System Prompt的情况下,发送User Prompt,AI会给我们通用的回复
当我们给AI大模型加上Prompt的时候,就相当于给了AI一个角色、性格、背景知识、语气等等设定,只要不是用户输入的,都可以是System Prompt

System Prompt:就是提前给Agent预设好的人设,比如豆包这里,你可以选择你的Agent的方向

User Prompt:用户说的话,如下图:什么是Java

Agent Tool
根据上面的了解,AI还只是一个能够进行问答的机器人,实际完成任务,动手的还是你自己,那能不能让AI自己去完成任务呢?
比如说我想让AI帮我管理电脑里的文件,那得先写好一些文件的管理函数,比如list_files用于列目录和read_file用来读文件等等
使用方法将这些能力注册到AI中,AI就会根据这些能力去生成System Prompt,让AI模型知道用户给了你哪些工具 ,Agent将系统预设和用户消息发送给AI,并将工具信息一同放在System Prompt中

AI收到消息后进行任务的执行

但是AI其实还是一个概率模型,会出现AI返回的格式不对,此时Agent就会进行反复的重试(消耗很多Token)

Function Coding
我们通过将工具的信息和调用格式发送给了AI,在System Prompt中,但是这些描述都是通过自然语言随意写的,只要AI看得懂就行
Function Coding则对这些描述进行了标准化,比如将工具的信息都通过json的格式进行描述
json
{
"name": "list_files", // 工具名
"desc": "列出目录", // 工具描述
"params": { // 工具调用所需要的参数
"path": "str"
}
}
AI调用工具时的回复也进行了标准化
json
{
"type": "call",
"name": "list_files",
"args": {
"path": "/"
}
}
做好了标准化之后,可以将工具信息和调用格式从System Prompt中抽取出来了,此时那么此时整个调用链就变成了:

MCP
上面我们一直都在聊的是AI Agent和AI大模型之间的通信方式,那么AI Agent是怎么和Agent Tool进行通信的呢
最简单的方式,就是将Tool和Agent放在同一个程序里面,直接通过函数调用的方式就可以进行通信
可是这样的方式会导致很多Tool的功能其实是通用的,但是要在多个Agent中都写一份,这样显然是不合理的
把Tool变成服务,让所有的Agent都来调用,MCP其实就是通信协议,专门用来规范Agent和Tool服务之间是怎么交互的

MCP我们分为MCP Server和MCP Client
MCP Server也可以提供类似文件读写的服务如resources,也可以通过prompts来提供专门的提示词模版
MCP Server和MCP Client可以两者都跑在一个机器上,通过标准的输入输出进行通信,也可以部署在网络上,通过http协议进行通信
MCP虽然是为了AI而定制出来的标准,但是MCP和AI大模型是没有关系的,MCP只负责帮Agent管理工具、资源和提示词

总结
回顾上面的全部流程,我们总结成一张图,将上述的内容全部串联起来
