让模型学会列清单 —— 规划和持久化

第四篇:让模型学会列清单 ------ 规划和持久化

模型不是鱼,它的记忆不止 7 秒------但也没长到能记住 100 轮对话里的所有事。


那个经典的翻车现场

你:"帮我重构这个模块,分三步:第一步提取接口,第二步实现新逻辑,第三步迁移测试。"

模型:"好的,我来处理!"

第 5 轮对话后,模型突然开始写一个完全不相干的文件......它迷路了。

这不是模型笨。这是缺少短期记忆管理。最初的计划被挤到了不知道哪个角落。

s03 的解法:TodoManager + Nag Reminder

python 复制代码
class TodoManager:
    def __init__(self):
        self.items = []

    def update(self, items: list) -> str:
        ...

    def render(self) -> str:
        lines = []
        for item in self.items:
            marker = {"pending": "[ ]", "in_progress": "[>]", "completed": "[x]"}[item["status"]]
            lines.append(f"{marker} #{item['id']}: {item['text']}")
        ...
        return "\n".join(lines)

渲染出来:

复制代码
[>] #1: 提取数据访问接口
[x] #2: 实现新的 Repository 类
[ ] #3: 迁移测试用例

(1/3 completed)

更有意思的是 Nag Reminder------模型每 3 轮没用 todo 工具,就塞一条提醒:

python 复制代码
rounds_since_todo = 0 if used_todo else rounds_since_todo + 1
if rounds_since_todo >= 3:
    results.append({"type": "text", "text": "<reminder>Update your todos.</reminder>"})

你不是强制模型做什么,你是给它一个信号,让它自己意识到该更新计划了。

s07 的进化:从 TODO 到持久化任务

s07 把 TODO 从内存列表升级为磁盘上的 JSON 文件

json 复制代码
{
  "id": 1,
  "subject": "Extract database interface",
  "status": "completed",
  "blockedBy": [],
  "owner": ""
}

为什么要持久化?因为上下文压缩(s06)随时可能把你的对话变成一个摘要。如果任务只存在于 messages 里,一压缩就没了。

任务系统还加了依赖图

复制代码
[x] #1: 提取数据访问接口
[>] #2: 实现新的 Repository 类
[ ] #3: 迁移测试用例 (blocked by: [2])

规划工具的关键设计原则

Harness 提供结构化的状态管理。模型提供决策。两者各司其职。

坏的做法:框架强定 workflow,模型只是管道里的一环。

好的做法:提供状态管理工具,让模型自己规划。

又回到了那个核心思想:模型是司机。

从 TODO List 到任务板的进化链

复制代码
s03: TodoManager(内存列表)
s07: TaskManager(JSON 文件,依赖图)
s11: 自主认领 + 任务板
s12: 任务 + Worktree 绑定(控制平面和执行平面分离)

下一篇:Subagent ------ 进程隔离就是上下文隔离

相关推荐
xian_wwq2 小时前
【学习笔记】Harness到底是什么
笔记·学习·ai·harness
二哈赛车手2 小时前
新人笔记---项目中简易版的RAG检索后评测指标(@Recall ,Mrr..)实现
java·开发语言·笔记·spring·ai
晨启AI2 小时前
GPT-5.5 来了!OpenAI 最新提示词指南深度解读
大数据·人工智能·ai·提示词
一切皆是因缘际会2 小时前
可落地数字生命工程:从记忆厮杀到自我意识觉醒全链路,AGI内生智能硅基生命心智建模
人工智能·深度学习·算法·机器学习·ai·系统架构·agi
菩提小狗3 小时前
每日极客日报 · 2026年05月03日
ai·开源·极客日报·it热点·技术资讯
金智维科技官方3 小时前
AI智能体在7×24客服场景中的真实表现评估
大数据·人工智能·ai·rpa·智能体
x-cmd3 小时前
agent-browser 使用指南:自动化浏览器,但请 responsibly
ai·浏览器自动化·cdp
宝桥南山3 小时前
Microsoft Fabric - 尝试一下使用Shortcut Transformation进行数据同步
microsoft·ai·微软·database·powerbi·fabric
qcx234 小时前
【AI Agent通识九课】01 · Agent 和 ChatGPT 到底差在哪?
人工智能·ai·chatgpt·agent