理论学习:什么是 Coding Agent?

读代码 → 理解 → 做决策 → 写代码 → 看结果 → 调整 → 再来一轮

这就是 Coding Agent 做的事情。而这门课,就是教你从零把这样一个东西造出来。

所以 Agent 到底是什么

LLM 是大脑,负责理解和思考。没有它,就没有「理解任务」的能力。

循环意味着不是一次性问答就结束。做完一步,看看结果,再决定下一步。就像你调试代码,不可能跑一次就完美,总要反复几轮。

环境反馈是关键中的关键。Agent 每做一步操作,都能感知到结果。执行了一个命令,拿到了输出;读了一个文件,拿到了内容;跑了一个测试,拿到了报错信息。这些反馈驱动着下一轮决策。

自主使用工具是说 Agent 自己判断该用什么工具。是该读文件还是写文件?是该搜索代码还是执行命令?这些决策由 LLM 自己做,不是你预先写好的 if-else 逻辑。

你可能会问:这四个要素缺一个行不行?

不行。缺了 LLM,没有理解和推理能力,就是一个死板的脚本。缺了循环,只能做一步就停,碰到意外情况就傻了。缺了反馈,Agent 就像闭着眼开车,不知道自己做的对不对。缺了工具,Agent 就是个空想家,想了一大堆但什么都做不了。

四个要素缺一不可。这就是 Agent 的全部本质。没有什么魔法,也不神秘。

Spec 模式:给 AI 一套施工图纸

直接把需求丢给 AI 让它写代码,效果往往不稳定。有时候写出来的东西偏离需求,有时候漏掉关键细节,有时候做着做着方向就歪了。

一个简单有效的做法是,把需求按四份文档组织起来再交给 AI:

|-----------------|-----------|---------------------------------------|
| ​文档​​ | ​回答什么​​ | ​包含什么​​ |
| ​spec.md​​ | ​做什么​​ | ​背景、目标、功能需求、非功能需求、边界(明确哪些留给后续)、验收标准​​ |
| ​plan.md​​ | ​怎么做​​ | ​架构概览、组件划分、核心接口与数据结构、模块交互、技术决策​​ |
| ​task.md​​ | ​按什么顺序做​​ | ​文件清单、有序任务列表、每个任务的步骤和验证方式​​ |
| ​checklist.md​​ | ​做对了没​​ | ​可观测的行为检查、集成检查、端到端场景​​ |

这四份文档的关系你可以这样理解:spec 定义做什么,plan定义怎么做,tasks 规划按什么顺序做,checklist 确认做没做完。后续每一章的提示词都会按这个结构组织。

AGENT.md

复制代码

# MewCode我正在构建一个终端 AI 编程助手(类似 Claude Code),项目名叫 GusCode,使用 Java实现。## 语言中文回答,中文注释。## 测试 开发完功能后,用 tmux 做端到端测试: 1. 在 tmux 中启动 MewCode 2. 输入一段真实的对话请求 3. 观察 GusCode是否正确调用工具、生成回复 4. 对照 checklist.md 逐项验收

相关推荐
自传.1 小时前
尚硅谷 Vibe Coding|第三章(1) Claude Code深度使用与进阶技巧 学习笔记
笔记·学习·尚硅谷·vibecoding
踏着七彩祥云的小丑1 小时前
Go学习第9天:并发编程 + 文件操作 + 正则表达式
学习·golang·正则表达式·go
有Li2 小时前
PTCMIL:基于提示 token 聚类的全切片图像多实例学习分析文献速递/多模态医学影像最新进展
论文阅读·学习·数据挖掘·聚类·文献·医学生
憧憬成为web高手2 小时前
l33t-hoster
学习·web安全·网络安全
Dick5072 小时前
ROS2 常用命令表
人工智能·学习·算法·机器人
qeen872 小时前
【Linux】Linux简单介绍与基本指令(上)
linux·运维·服务器·学习
.千余2 小时前
【C++】模板进阶全解:非类型参数|全特化|偏特化|分离编译完全指南
开发语言·c++·笔记·学习·其他
自传.2 小时前
尚硅谷 Vibe Coding|第二章 AI编程工具生态 学习笔记
笔记·学习·ai编程·尚硅谷·vibe coding
库奇噜啦呼3 小时前
【iOS】RunLoop学习
学习·ios