过去这段时间,我们一直在做一件事:不是再造一个"更会聊天"的助手,而是尝试搭出一套真正能够持续学习、持续记忆、持续决策、持续执行的智能体系统。
现在,这套系统已经有了一个初步闭环。
我们的学习系统是 claude-obsidian,记忆系统是 Obsidian,决策系统是 cli-assistant,执行系统是 Harness_engineering。这四个模块协同起来,已经能够完成一些简单项目。这意味着一件很重要的事:我们不是在拼装几个孤立工具,而是在把智能体最核心的能力链路真正连起来。
这条链路一旦成立,智能体就不再只是"回答问题",而是开始具备一种持续演化的可能性。
我们做成了什么
如果用一句话概括当前阶段的成果,那就是:
学习、记忆、决策、执行,已经形成了一个基础闭环。
在这个闭环里:
-
claude-obsidian负责学习,把任务、代码、文档、经验中的信息提炼成结构化知识。 -
Obsidian负责记忆,把知识、经验和上下文沉淀下来,形成可复用的知识网络。 -
cli-assistant负责决策,根据已有知识和当前任务判断下一步该做什么。 -
Harness_engineering负责执行,把决策真正推进到工程环境里,完成动作、拿回反馈。
这四个环节协同之后,系统开始具备一个关键能力:不是一次性完成任务,而是能在任务过程中积累经验,并把经验重新带回下一轮任务。
也就是说,它开始有了"边做边学、越做越懂"的雏形。
这件事为什么重要
很多智能体系统的问题,从来都不是某个单点能力不够强,而是链路断裂。
有的系统会学习,但记不住;有的系统记住了,但调不出来;有的系统能做决策,但不能执行;有的系统能执行,但执行结果不会反哺学习。只要其中任意一个环节断掉,系统就无法形成真正的积累,也无法进入更复杂的真实场景。
我们当前最大的进展,不是某个模块又提升了多少,而是第一次把这些关键能力真正串起来了。
这是从"工具能力"走向"系统能力"的分界线。
目前已经能做一些简单项目
现在,这套系统已经能够支撑一些简单项目的推进。
这里说的"简单项目",不是只会跑个 demo,也不是只会生成几段代码,而是系统已经能够在一定范围内理解任务、调用已有知识、做出局部判断,并把判断推进到实际执行中。
这说明两点:
-
这套架构不是纸面设计,已经具备实际运转能力。
-
闭环不是概念性的,而是能够在任务中真正工作。
这一步并不轰动,但非常关键。因为所有更高级的能力,前提都是先把最基础的闭环跑通。
但这还不算真正落地
我们对当前阶段的判断也很清楚:现在还只是基础阶段。
虽然系统已经能做一些简单项目,但这还远远不等于真正落地。真正的落地,不是跑通一个样例,不是做出几个模块,而是能够在复杂环境里稳定工作,能够面对大型项目、长期任务、复杂上下文,还能持续产出有效结果。
换句话说:
只有跑通大的项目,才算真正落地。
因为一旦进入大项目,问题会立刻变得完全不同:
-
上下文更长、更复杂
-
模块更多、依赖更深
-
历史包袱和技术债更重
-
需求变化更频繁
-
决策和执行都需要更强的连续性
到了这个阶段,考验的就不再是"会不会做",而是"能不能持续做、能不能快速理解、能不能在复杂性里保持效率"。
所以我们接下来的重点,不是继续停留在小范围验证,而是把系统真正推到大项目里去检验。
下一步,我们会重点推进三件事
1. 把学习系统和记忆系统合到一起,做"智慧大脑"
这是我们下一阶段最优先的方向。
目前学习系统和记忆系统虽然已经打通,但本质上仍然是两个相对独立的模块。接下来,我们希望把 claude-obsidian 和 Obsidian 更深度地融合起来,形成一个真正意义上的"智慧大脑"。
为什么一定要这么做?
因为学习如果不能快速进入记忆网络,就很难形成持续积累;而记忆如果不能反过来参与学习,也只是静态存储。我们想做的,不是"学完以后存起来",而是让学习和记忆本身就成为同一个循环过程。
我们希望这个"智慧大脑"具备几个关键特征:
-
能快速把新的输入挂接到已有知识网络
-
能形成跨主题、跨任务、跨项目的关联记忆
-
能让经验不只是被记录,而是能被反复调取和复用
-
能沉淀出更接近类人的长期记忆能力
我们的目标,是加速自主学习和知识循环,希望最终能实现类人的关联记忆和永久记忆。
如果这一步能做出来,智能体就不再只是"每次重新理解世界",而是开始真正拥有自己的知识连续性。
2. 在大项目中实践落地,解决"如何快速感知项目、快速学习"的问题
第二个方向,是把系统真正放进大项目里打磨。
现实里的大型项目,不会给智能体很长的适应时间。它必须尽快理解项目结构、核心模块、关键约束、历史演化和当前问题,否则就无法参与真正的工程协作。
所以我们接下来要重点解决两个问题:
-
智能体如何快速感知一个项目
-
智能体如何快速学习一个项目
"快速感知项目",不是机械地扫一遍代码,而是能迅速识别什么是核心、什么是边缘、什么是高风险区域、什么是关键依赖。
"快速学习项目",也不是读完文档就算结束,而是要能结合代码、文档、提交记录、任务上下文和运行反馈,建立对项目的动态理解,并把这种理解沉淀到记忆系统中,支持后续决策和执行。
如果这一层做不出来,智能体就很难真正进入真实工程环境。因为真实项目的门槛,从来都不只是写代码,而是能不能快速进入上下文。
3. 面向新的大型项目,具备做需求和重构的能力
第三个方向,是让系统从"能执行任务"进一步走向"能参与工程判断"。
我们希望未来这套系统面对一个新的大型项目时,不只是接受明确指令再执行,而是能够参与需求理解、任务拆解、系统分析,甚至承担部分重构工作。
这意味着它要逐步具备这些能力:
-
面对陌生项目,快速建立需求上下文
-
从模糊描述中提炼目标、约束和边界
-
识别系统中的结构问题和重构机会
-
对复杂改动形成分阶段推进方案
-
在执行过程中持续修正理解,而不是一次性拍脑袋决策
需求分析和系统重构,是最能检验智能体工程能力的场景之一。因为这类问题没有标准答案,它要求系统不仅"会做",还要"会判断"。
如果我们能在新的大型项目中把这件事跑通,这套系统才算真正从实验阶段走向工程级落地。
最后
回头看,我们已经从单点能力探索,走到了系统级闭环的初步成形。
学习系统、记忆系统、决策系统、执行系统,已经开始协同工作,并且已经能够支撑一些简单项目向前推进。这说明我们的方向是对的。
但我们也非常清楚,这还只是开始。
真正的挑战,不是把闭环搭出来,而是让这个闭环在大型项目中持续运转,让系统真正拥有长期学习、长期记忆、复杂决策和工程执行的能力。只有到了那一步,才算真正落地。
接下来,我们会继续沿着三个方向推进:
-
把学习系统和记忆系统融合成"智慧大脑"
-
推动大项目实践落地,解决快速感知和快速学习问题
-
让系统具备面对新大型项目做需求分析和重构的能力
如果说现在我们已经证明了"闭环可以成立",那么下一阶段要证明的,就是这套闭环能不能成为真正可用、可扩展、可持续进化的智能体工程体系。