让模型学会列清单 —— 规划和持久化

第四篇:让模型学会列清单 ------ 规划和持久化

模型不是鱼,它的记忆不止 7 秒------但也没长到能记住 100 轮对话里的所有事。


那个经典的翻车现场

你:"帮我重构这个模块,分三步:第一步提取接口,第二步实现新逻辑,第三步迁移测试。"

模型:"好的,我来处理!"

第 5 轮对话后,模型突然开始写一个完全不相干的文件......它迷路了。

这不是模型笨。这是缺少短期记忆管理。最初的计划被挤到了不知道哪个角落。

s03 的解法:TodoManager + Nag Reminder

python 复制代码
class TodoManager:
    def __init__(self):
        self.items = []

    def update(self, items: list) -> str:
        ...

    def render(self) -> str:
        lines = []
        for item in self.items:
            marker = {"pending": "[ ]", "in_progress": "[>]", "completed": "[x]"}[item["status"]]
            lines.append(f"{marker} #{item['id']}: {item['text']}")
        ...
        return "\n".join(lines)

渲染出来:

复制代码
[>] #1: 提取数据访问接口
[x] #2: 实现新的 Repository 类
[ ] #3: 迁移测试用例

(1/3 completed)

更有意思的是 Nag Reminder------模型每 3 轮没用 todo 工具,就塞一条提醒:

python 复制代码
rounds_since_todo = 0 if used_todo else rounds_since_todo + 1
if rounds_since_todo >= 3:
    results.append({"type": "text", "text": "<reminder>Update your todos.</reminder>"})

你不是强制模型做什么,你是给它一个信号,让它自己意识到该更新计划了。

s07 的进化:从 TODO 到持久化任务

s07 把 TODO 从内存列表升级为磁盘上的 JSON 文件

json 复制代码
{
  "id": 1,
  "subject": "Extract database interface",
  "status": "completed",
  "blockedBy": [],
  "owner": ""
}

为什么要持久化?因为上下文压缩(s06)随时可能把你的对话变成一个摘要。如果任务只存在于 messages 里,一压缩就没了。

任务系统还加了依赖图

复制代码
[x] #1: 提取数据访问接口
[>] #2: 实现新的 Repository 类
[ ] #3: 迁移测试用例 (blocked by: [2])

规划工具的关键设计原则

Harness 提供结构化的状态管理。模型提供决策。两者各司其职。

坏的做法:框架强定 workflow,模型只是管道里的一环。

好的做法:提供状态管理工具,让模型自己规划。

又回到了那个核心思想:模型是司机。

从 TODO List 到任务板的进化链

复制代码
s03: TodoManager(内存列表)
s07: TaskManager(JSON 文件,依赖图)
s11: 自主认领 + 任务板
s12: 任务 + Worktree 绑定(控制平面和执行平面分离)

下一篇:Subagent ------ 进程隔离就是上下文隔离

相关推荐
G_whang12 小时前
Codex CLI 安装与国内模型配置指南
ai
Sam092713 小时前
AI Agent 沙箱怎么做:从文件、网络、工具到权限边界的工程实践
人工智能·ai
赤龙ERP13 小时前
赤龙一周观察 · 6月第2周
大数据·人工智能·ai·erp
小庞在加油14 小时前
从qmake到CMake+VSCode:Qt项目现代化迁移与AI提效实战指南
vscode·qt·ai·ai工具
John_ToDebug14 小时前
Chromium 132→148 升级实战:Legacy IPC 消息丢失问题深度解析
c++·chrome·ai·架构
笨蛋©14 小时前
[实战] 2026年制造业数字化质量审核 (Quality Audit) 深度解析
ai·数字化·质量管理·制造业·fai
FBI HackerHarry浩14 小时前
Ollama如何安装到D盘
python·ai
humors22114 小时前
AI案例:头脑风暴创作-正反论证-报告撰写-摘要总结
人工智能·ai·写作·总结·案例·论证
Sam092714 小时前
OpenClaw 和 Hermes 怎么结合:从聊天入口到隔离执行器的 Agent 工程实践
人工智能·ai