理论学习：什么是 Coding Agent？

读代码 → 理解 → 做决策 → 写代码 → 看结果 → 调整 → 再来一轮

这就是 Coding Agent 做的事情。而这门课，就是教你从零把这样一个东西造出来。

所以 Agent 到底是什么

LLM 是大脑，负责理解和思考。没有它，就没有「理解任务」的能力。

循环意味着不是一次性问答就结束。做完一步，看看结果，再决定下一步。就像你调试代码，不可能跑一次就完美，总要反复几轮。

环境反馈是关键中的关键。Agent 每做一步操作，都能感知到结果。执行了一个命令，拿到了输出；读了一个文件，拿到了内容；跑了一个测试，拿到了报错信息。这些反馈驱动着下一轮决策。

自主使用工具是说 Agent 自己判断该用什么工具。是该读文件还是写文件？是该搜索代码还是执行命令？这些决策由 LLM 自己做，不是你预先写好的 if-else 逻辑。

你可能会问：这四个要素缺一个行不行？

不行。缺了 LLM，没有理解和推理能力，就是一个死板的脚本。缺了循环，只能做一步就停，碰到意外情况就傻了。缺了反馈，Agent 就像闭着眼开车，不知道自己做的对不对。缺了工具，Agent 就是个空想家，想了一大堆但什么都做不了。

四个要素缺一不可。这就是 Agent 的全部本质。没有什么魔法，也不神秘。

Spec 模式：给 AI 一套施工图纸

直接把需求丢给 AI 让它写代码，效果往往不稳定。有时候写出来的东西偏离需求，有时候漏掉关键细节，有时候做着做着方向就歪了。

一个简单有效的做法是，把需求按四份文档组织起来再交给 AI：

|-----------------|-----------|---------------------------------------|
| 文档 | 回答什么 | 包含什么 |
| spec.md | 做什么 | 背景、目标、功能需求、非功能需求、边界（明确哪些留给后续）、验收标准 |
| plan.md | 怎么做 | 架构概览、组件划分、核心接口与数据结构、模块交互、技术决策 |
| task.md | 按什么顺序做 | 文件清单、有序任务列表、每个任务的步骤和验证方式 |
| checklist.md | 做对了没 | 可观测的行为检查、集成检查、端到端场景 |

这四份文档的关系你可以这样理解：spec 定义做什么，plan定义怎么做，tasks 规划按什么顺序做，checklist 确认做没做完。后续每一章的提示词都会按这个结构组织。

AGENT.md

复制代码

# MewCode我正在构建一个终端 AI 编程助手（类似 Claude Code），项目名叫 GusCode，使用 Java实现。## 语言中文回答，中文注释。## 测试 开发完功能后，用 tmux 做端到端测试： 1. 在 tmux 中启动 MewCode 2. 输入一段真实的对话请求 3. 观察 GusCode是否正确调用工具、生成回复 4. 对照 checklist.md 逐项验收