Prompt,Agent,Skills,MCP,Claude,Code,Cursor,Context,API,Token,RAG,Embedding
把手里的工具想象成你开的一家公司。需要招人、分活、买工具、办门禁等。
每一个技术概念都对应着公司里的一个角色或物品
bash
LLM(天才员工)
│
├── Prompt(口头交代)
├── Skill(SOP手册)
├── Context(桌面资料)
├── MCP(门禁卡)
├── API(电话系统)
├── RAG(档案室)
├── Embedding(资料坐标)
│
└── Agent(自主工作模式)
│
└── IDE(智能办公室)
一、 大模型 (LLM) = 你招来的"天才员工"
- 定义:GPT、Claude、DeepSeek、Gemini 等都是大模型 。
- 特征:聪明绝顶,文能写方案,武能改代码 。
- 痛点:他是个刚入职的新人,不熟你家的规矩,不知道业务流程,甚至不知道厕所在哪 。
- 核心任务:后面所有的概念,本质上都是在解决"如何让这个天才员工真正变成你公司的人" 。
二、 Prompt = 你给他的"当面口头交代"即--提示词
- 定义:你走到工位旁,当面跟他说的指令 。
- 特征:
-
- 即时性:有用,但说完就没了 。
- 临时性:是一次性的指令,用完即弃 。
- 局限性:他不一定能记住你昨天的要求,不持久 。
三、 Agent = 员工"自己干活"的状态 即--智能体
- 定义:Agent 不是具体的产品名,而是一种工作模式 。
- 工作流:以前是你拨一下动一下;现在你给一个目标,他自己拆解任务、规划步骤、调用工具、检查结果 。
- 威力:你给目标,他给结果。以前花两三天的活,Agent 模式下不到半小时交卷 。
四、 Skill = 你给他发的"SOP 手册"
- 定义:你写下来的公司内部标准操作程序(SOP) 。
- 包含内容:标准流程、方案模板、优秀参考案例、辅助脚本 。
- 与 Prompt 的区别:Prompt 是口头交代(易忘),Skill 是写下来的手册(可随时翻阅、复用) 。
- 价值:Skill 越厚,AI 越像老员工,产出越标准稳定 。
五、 MCP (Model Context Protocol) = 你给他办的"门禁卡"
- 定义:一套让 AI 用同一种方式打开不同系统大门的规矩 。
- 功能:刷开数据库的门、CRM 的门、代码仓库的门、搜索引擎的门 。
- 核心逻辑:Skill 教他怎么干活(能力),MCP 让他能进门干活(权限) 。
六、 IDE = 已经坐了 AI 助手的"智能办公室"
- 定义:程序员写代码的软件,但现在是全套设备 + AI 员工 + 门禁系统都配好的智能空间 。
- 主流派系:
-
- 办公室派 (GUI) :如 Cursor, Trae, Windsurf。像在办公室干活的白领,你能看到他改了哪行代码 。
- 特种兵派 (CLI) :如 Claude Code, OpenCode。直接在终端(Terminal)干活,手感更好、反应更快,适合复杂场景 。
- Trae--字节跳动做的 AI IDE ,内置 Agent 模式,中文支持好,免费额度多
七、 Context = 员工当前能看到的所有信息(上下文)
**定义:**上下文(Context)就是 AI 在当前对话中能够看到的全部内容。
包括: 当前问题 , 历史对话 , 上传的文档 , Skill 手册 , 系统规则 , MCP 获取的数据
**类比:**你让员工工作时,桌上摆着: 客户需求 , 历史邮件 , 公司 SOP , 数据报表 , 参考代码
员工只能根据眼前这些资料来完成任务。
核心特点: 上下文越完整,AI 输出越准确 , 上下文越混乱,AI 越容易答非所问 , 超出上下文窗口的内容会被"遗忘" 。
举例: 当你在 Cursor 中使用 AI 时: 当前打开的代码文件 , 选中的代码段 , 项目结构 , 聊天记录
都会作为上下文提供给模型。
八、 Token = AI 阅读和收费的最小单位(令牌)
**定义:**Token 是模型处理文本的基本单位。它不是严格意义上的"字"或"单词",而是模型内部切分后的文本片段。
类比:就像快递按"重量"收费一样,AI 按 Token 计费。
粗略估算:
- 1 个英文单词 ≈ 1~2 Token
- 1 个汉字 ≈ 1~2 Token
- 1000 个中文字符 ≈ 1500~2000 Token
作用: 决定模型能读取多少内容 , 决定 API 调用成本 , 决定上下文窗口大小
**举例:**如果模型上下文窗口是 200K Token,相当于可以同时阅读几十万字资料。
九、 API = 与 AI 沟通的电话系统(应用程序接口)
**定义:**API 是程序调用 AI 服务的标准接口。
**类比:**除了当面下达 Prompt,你还可以通过电话给员工安排任务。
常见使用方式
- 网站聊天(如 ChatGPT)
- IDE 调用
- Python 脚本调用
- 企业系统集成
Python 示例
from openai import OpenAI
client = OpenAI()
response = client.responses.create(
model="gpt-5",
input="解释什么是 Agent"
)
print(response.output_text)
作用: 自动化调用 , 批量处理 , 与业务系统集成
十、 RAG = 员工不会时去查资料库
**定义:**RAG(Retrieval-Augmented Generation,检索增强生成)是:先检索相关资料,再交给模型回答。
类比:员工记不住所有知识时,会先到档案室查资料,再写报告。
工作流程
- 提问
- 检索知识库
- 获取相关文档
- 将文档加入上下文
- 模型生成答案
作用: 减少幻觉 , 引入企业私有知识 , 保持回答更新
十一、 Embedding = 给每份资料贴上坐标
**定义:**Embedding(向量化)是把文本转换成数字坐标。
**类比:**把每份文件放到地图上的某个位置。意思越接近,位置越靠近。
用途: 相似搜索 , 知识库检索 , 推荐系统 , RAG
总结
Prompt 是临时指令,Skill 是长期经验,Context 是当前资料,MCP 是系统权限,Agent 是自主工作模式,RAG 是查资料机制,IDE 是工作的办公室,API 是自动化调用方式,而 LLM 则是核心的"天才员工"。