前端学习 Agent 开发更文已经坚持了 16 天了,前两天和朋友聊天,问他的建议,他给我的反馈是:
"我不懂你在做什么,我平时用豆包,或者开发工具里的 AI 助手,我觉得这些都是模型的能力,我分不出来 Agent 到底做了什么。你的文章让我迷惑,我不知道看的目的是什么?也不知道看完会给我带来什么?你的文章零帧起手,让我有点措手不及。"
说实话,这个反馈让我愣了一下。
我翻了自己前两周的文章,发现确实有个问题------我一直在讲"怎么做",但从来没好好讲过"为什么"。
读者进来看到一堆代码、一堆术语,然后就懵了:这玩意儿和 ChatGPT 有啥区别?我直接用豆包不就完了吗?
所以,今天我决定换个方式,先讲清楚三个问题:
- 我在做什么?
- Agent 和大模型到底啥区别?
- 看完这些文章你能获得什么?
一、我在做什么?
简单说,我在做一个英语单词学习工具。
不是那种打开 ChatGPT 问"cat 是什么意思"的工具,而是:
- 打开 App,系统自动给你一个单词
- 你答错了,系统自动记到错题本
- 下次打开,系统自动从错题本里挑题复习
- 学完有积分,激励你坚持
一句话总结:把"每次都要自己手动做的事"变成"系统自动帮你做"。
二、Agent 和大模型有啥区别?
这是朋友最困惑的地方,我举几个真实例子来说明。
例子 1:学单词
| 场景 | 用豆包/ChatGPT | 用我做的 Agent |
|---|---|---|
| 想学一个单词 | 我输入:"cat 是什么意思" | 系统自动给我一个单词 |
| 答错了 | 我自己记下来 | 系统自动记到错题本 |
| 下次复习 | 我自己翻笔记找错题 | 系统自动从错题本挑题 |
| 想知道学了几个 | 我自己数 | 系统自动显示积分 |
区别很明显:
- 大模型:我问它答,被动,我每次都要自己操作
- Agent:系统主动帮我做事,自动化
例子 2:写代码
| 场景 | 用 Cursor 的 AI | 用 Agent 思路 |
|---|---|---|
| 想写个功能 | 我描述需求,AI 生成代码 | 我描述需求,Agent 自动写代码、自动测试、自动修复报错 |
| 代码报错了 | 我把报错贴给 AI,让它修 | Agent 自动检测报错,自动修复 |
| 想重构代码 | 我一段一段让 AI 改 | Agent 自动扫描整个项目,找出需要重构的地方 |
Cursor 的 AI 已经有点 Agent 的味道了,但它还是依附在编辑器里。一个完整的 Agent 可以更独立------比如你下班了,Agent 还在后台跑,帮你写完剩下的代码。
例子 3:日常办公
| 场景 | 用豆包/ChatGPT | 用 Agent |
|---|---|---|
| 每天早上写日报 | 我打开网页,输入"帮我写日报",把昨天做的事贴给它 | Agent 自动读取我昨天的 Git 记录、日程,自动生成日报发到群里 |
| 每周整理会议纪要 | 我把录音贴给 AI,让它总结 | Agent 自动参加会议(录音),自动总结,自动发邮件 |
| 想查某个项目的历史 | 我问 AI,它说不知道 | Agent 自动翻公司文档、Git 历史,找出答案 |
看出来了吗?Agent 的核心价值是"自动化"------你不用每次都手动触发,它会主动帮你做。
三、大模型能做什么,Agent 能做什么?
这个表格可能对你有用:
| 能力 | 大模型 | Agent |
|---|---|---|
| 回答问题 | ✅ 能(这是核心能力) | ✅ 能(继承大模型) |
| 主动执行任务 | ❌ 不能(你问它才答) | ✅ 能(程序调度) |
| 记住信息 | ❌ 不能(每次对话重新开始) | ✅ 能(记忆系统) |
| 调用外部 API | ❌ 不能 | ✅ 能(工具调用) |
| 读取本地文件 | ❌ 不能 | ✅ 能 |
| 有界面让人操作 | ❌ 没有(只能聊天) | ✅ 能有(网页、App) |
| 后台自动运行 | ❌ 不能 | ✅ 能 |
| 有"性格"和行为模式 | ❌ 只有回答风格 | ✅ 能设计(System Prompt + 程序逻辑) |
一句话:大模型是"脑子",Agent 是"脑子 + 手脚 + 记忆 + 工具"。
四、看完这些文章你能获得什么?
如果你的情况和我朋友类似------平时用 AI 工具,但不知道 Agent 是啥、为什么需要 Agent------那这些文章能帮你:
1. 搞清楚概念
看完 Week 1 和 Week 2,你能明白:
- 大模型 vs Agent 的区别
- 为什么有时"直接用 ChatGPT 不够用"
- Agent 能解决什么问题
2. 学会动手做一个 Agent
这些文章是实战笔记,不是理论书。你可以跟着做:
- Week 1:做一个命令行 Agent(最简单,1 小时搞定)
- Week 2:做一个网页版 Agent(有界面、有积分、有错题本)
代码都贴出来了,你复制就能跑。
3. 理解 Agent 的技术组成
| 技术组件 | 什么时候学 |
|---|---|
| 大模型 API 调用 | Week 1 Day 1 |
| System Prompt(给 AI 设定"性格") | Week 1 Day 2 |
| 流式输出(边想边说) | Week 2 Day 3 |
| 记忆系统(记住对话历史) | Week 2 Day 5 |
| Function Calling(让 AI 调用函数) | Week 3(接下来会学) |
学完这些,你不仅能"用"Agent,还能"改"Agent、"造"Agent。
五、接下来我要做什么?
Week 2 结束了,我做了一个能用的英语学习 Agent:
- 有网页界面
- 能学习单词、测验、造句、编故事
- 有积分激励
- 有错题本自动记录
接下来 Week 3,我要学更高级的东西:
| 计划学的内容 | 解决什么问题 |
|---|---|
| Function Calling | 让 Agent 能自己决定"调用什么函数" |
| RAG(检索增强生成) | 让 Agent 能读取你的文档、数据 |
| 多模态 | 让 Agent 能看图片、听语音 |
这些东西会让 Agent 更"聪明"、更"独立"。
写在最后
如果看完这篇文章,你还是觉得"我直接用豆包就够了"------那说明你现在遇到的问题,确实不需要 Agent。
Agent 的价值在于"自动化"------当你发现自己每天都在重复做某件事,而且这件事可以用 AI 辅助,那 Agent 就有价值了。
比如:
- 每天写日报 → Agent 自动写
- 每天整理邮件 → Agent 自动整理
- 每天学单词 → Agent 自动安排学习计划
不是所有事都需要 Agent,但有些事,Agent 能帮你省很多时间。
好了,今天就讲到这。明天开始 Week 3,我会继续写实战笔记。
如果你有想学的 Agent 功能,可以告诉我,我把它加到学习计划里。
写于 2026-04-16,搞明白Agent是什么
