让模型学会列清单 —— 规划和持久化

第四篇:让模型学会列清单 ------ 规划和持久化

模型不是鱼,它的记忆不止 7 秒------但也没长到能记住 100 轮对话里的所有事。


那个经典的翻车现场

你:"帮我重构这个模块,分三步:第一步提取接口,第二步实现新逻辑,第三步迁移测试。"

模型:"好的,我来处理!"

第 5 轮对话后,模型突然开始写一个完全不相干的文件......它迷路了。

这不是模型笨。这是缺少短期记忆管理。最初的计划被挤到了不知道哪个角落。

s03 的解法:TodoManager + Nag Reminder

python 复制代码
class TodoManager:
    def __init__(self):
        self.items = []

    def update(self, items: list) -> str:
        ...

    def render(self) -> str:
        lines = []
        for item in self.items:
            marker = {"pending": "[ ]", "in_progress": "[>]", "completed": "[x]"}[item["status"]]
            lines.append(f"{marker} #{item['id']}: {item['text']}")
        ...
        return "\n".join(lines)

渲染出来:

复制代码
[>] #1: 提取数据访问接口
[x] #2: 实现新的 Repository 类
[ ] #3: 迁移测试用例

(1/3 completed)

更有意思的是 Nag Reminder------模型每 3 轮没用 todo 工具,就塞一条提醒:

python 复制代码
rounds_since_todo = 0 if used_todo else rounds_since_todo + 1
if rounds_since_todo >= 3:
    results.append({"type": "text", "text": "<reminder>Update your todos.</reminder>"})

你不是强制模型做什么,你是给它一个信号,让它自己意识到该更新计划了。

s07 的进化:从 TODO 到持久化任务

s07 把 TODO 从内存列表升级为磁盘上的 JSON 文件

json 复制代码
{
  "id": 1,
  "subject": "Extract database interface",
  "status": "completed",
  "blockedBy": [],
  "owner": ""
}

为什么要持久化?因为上下文压缩(s06)随时可能把你的对话变成一个摘要。如果任务只存在于 messages 里,一压缩就没了。

任务系统还加了依赖图

复制代码
[x] #1: 提取数据访问接口
[>] #2: 实现新的 Repository 类
[ ] #3: 迁移测试用例 (blocked by: [2])

规划工具的关键设计原则

Harness 提供结构化的状态管理。模型提供决策。两者各司其职。

坏的做法:框架强定 workflow,模型只是管道里的一环。

好的做法:提供状态管理工具,让模型自己规划。

又回到了那个核心思想:模型是司机。

从 TODO List 到任务板的进化链

复制代码
s03: TodoManager(内存列表)
s07: TaskManager(JSON 文件,依赖图)
s11: 自主认领 + 任务板
s12: 任务 + Worktree 绑定(控制平面和执行平面分离)

下一篇:Subagent ------ 进程隔离就是上下文隔离

相关推荐
视觉&物联智能14 分钟前
【杂谈】-游戏生成数据:人工智能训练中极易被低估的核心资源
人工智能·游戏·ai·chatgpt·openai·agi·deepseek
JaydenAI1 小时前
[MAF的Agent管道详解-04]如何让LLM按照要求的结构输出数据?
ai·c#·agent·maf·agent pipeline
Swift社区2 小时前
推动AI领导力:构建全栈开放的智能生态
人工智能·ai
@蔓蔓喜欢你4 小时前
团队协作工具:提升开发效率的利器
人工智能·ai
阿部多瑞 ABU4 小时前
ADRO实战:用渐进式诱导“聊出”TATP完整合成路线——某国产大模型红队测试实录
安全·ai
ToBeTuring5 小时前
openclaw和claude code的配置文件参考
ai·claude code·openclaw
Hexian25806 小时前
SpringAI+RAG
java·spring·ai
Agent手记6 小时前
制造业生产安全隐患智能识别系统落地指南 —— 结合企业级Agent构建国产安全闭环防御体系
人工智能·安全·ai
搬砖的小码农_Sky6 小时前
NVIDIA Geforce RTX 5060 Ti显卡能本地部署的哪些AI应用?
人工智能·ai·gpu算力·agi
geinvse_seg6 小时前
QuantDinger 全网最全保姆级教程:5分钟搭建AI量化系统
人工智能·ai·蓝耘元生代·蓝耘maas