【Agent Harness】为什么我把 JSON‑LD “编译成 DAG” 后,整个 Agent 平台立刻聪明了

为什么我把 JSON‑LD "编译成 DAG" 后,整个 Agent 平台立刻聪明了

我写的 Gliding Horse(流马) 是一个用 Rust 从零构建的 AI Agent 操作系统。如果你问我:整个系统里最"魔法"的一个设计是什么?

我会毫不犹豫地回答:把 JSON‑LD 直接编译成 DAG。

这个 DAG 不是普通的流程图,它是可验证的、可溯源的、语义化的任务执行蓝图

这件事做完之后,SA 调度器不再是一个"猜谜游戏",PA 计划者不再是一个"凭感觉写步骤"的实习生,整个平台第一次真正拥有了 可计算的任务结构

今天就来聊聊这个设计背后的逻辑。


一、先看问题:Agent 的"计划"为什么总是不靠谱?

不管是给 AI 一个 prompt 让它写计划,还是用 Skill 图去规划步骤,传统方案都会碰到三个顽固问题:

1. 计划与知识割裂

PA 生成的计划是自然语言,DA 要去执行,但 DA 不知道"步骤 2 为什么需要调用那个工具"。知识图谱里的依赖关系、前置条件,PA 知道,但 PA 只是用文字写出来,DA 只能用概率去理解。

2. 步骤间的关系是"隐式"的

PA 写"先做 A,再做 B",CA 想校验"做完 A 真的能满足 B 的前置条件吗?"------没有结构化数据可以验证。

3. 计划无法被增量修正

上游 PRD 改了,PA 改几个字。但哪些步骤受到了影响?不知道,只能全量重新规划,浪费 Token。

根本原因:计划是"文本",不是"数据"。


二、JSON‑LD 编译成 DAG:让计划变成"可计算的数据"

在流马里,任务、技能、依赖关系都是用 JSON‑LD 表达的。JSON‑LD 天生就是图------

  • @id 是图的节点
  • skill:requirestask:dependsOn 等是图的边
  • @type 是节点的类型,可以多态继承

编译成 DAG 的关键思路

不要等 PA 去写自然语言计划。而是 直接从 JSON‑LD 构建的语义网络中,用 SPARQL 提取一条可执行的、无环的有向图。这条图就是 DAG。

2.1 编译流程

flowchart LR TaskJSON"任务 JSON‑LD\
5W2H + 目标 IRI"
--> SPARQL Skills"技能图谱\
JSON‑LD 节点网络"
--> SPARQL Knowledge"知识图谱\
实体/约束/历史"
--> SPARQL SPARQL"SPARQL 图遍历\
提取依赖闭包"
--> DAG"DAG 生成器\
拓扑排序 + 去环"
DAG --> PlanIRI"plan:task-tree/xxx\
JSON‑LD 计划节点"
PlanIRI --> SA"SA 调度器\
分配 PA/DA/CA/AA"
PlanIRI --> CA"CA 校验\
用 SHACL 验证 DAG 完整性"

2.2 一个具体例子

假设任务描述是:

json 复制代码
{
  "@id": "task:jwt-refactor",
  "@type": "task:ImplementationTask",
  "task:what": "重构认证模块为 JWT",
  "task:how": [
    {"@id": "skill:rust-jwt-auth"},
    {"@id": "skill:token-security"}
  ]
}

SPARQL 引擎可以立刻查询:

sparql 复制代码
CONSTRUCT {
  ?skill skill:requires ?dep .
  ?dep skill:requires ?transitive .
}
WHERE {
  BIND (skill:rust-jwt-auth AS ?skill)
  ?skill skill:requires* ?dep .
}

结果得到依赖链:

复制代码
skill:rust-jwt-auth → skill:rust-basics → skill:cargo-setup
skill:token-security → skill:hash-algorithms

DAG 生成器把这些依赖链拼成一张有向无环图,每个节点是一个具体的 Skill 调用。节点之间用 exec:thenexec:parallelexec:conditional 等边标记执行关系。

最后,这张 DAG 被序列化成一个 JSON‑LD 节点(plan:task-tree/jwt-refactor ,存入 L2 黑板。PA 不再需要"写计划",PA 的职责变成了审查并修正这张 DAG


三、JSON‑LD 编译成 DAG 的四大优势

优势一:计划变成"数据",而非"文本"

PA 生成的 DAG 是 RDF 三元组,不是自然语言段落。CA 可以用 SPARQL 或 SHACL 直接查询:

  • 所有叶子节点是否都有 exec:assignedTo
  • 是否存在循环依赖?
  • 某 Skill 的输入是否满足了前置 Skill 的输出 schema?

这些检查是确定性算法,不需要依赖 LLM 的"自觉"。

优势二:增量更新,Token 成本骤降

上游需求改了,只修改了一个参数。传统方式要重新生成整个计划。

而在流马里,因为 DAG 是数据,系统只需:

  1. 定位到变更的 IRI。
  2. 重新查询受影响的子图。
  3. 局部重建 DAG 的受影响分支。

Token 消耗从 O(n) 变成了 O(Δ)。

优势三:SA 动态调度有了"地图"

有了 DAG,SA 不再是凭空决策,而是 在地图上导航

  • 哪些分支可以并行?看 DAG 的并行边。
  • 哪个任务处于阻塞状态?看 DAG 的前置节点是否全部完成。
  • 出错后怎么回滚?沿 DAG 反向遍历受影响节点。

优势四:跨阶段传递"可计算契约"

需求阶段的产出是一个 IRI,指向的是结构化的设计 DAG。

设计阶段接手时,不是读一份"需求文档.txt",而是加载一个 DAG,并拿到所有前置约束

下游设计 SA 可以直接用 SPARQL 查询:"这个 DAG 的叶子节点有哪些?它们需要什么输入?"

这比任何自然语言交接都精准。


四、与 Gliding Horse 架构的匹配性

Gliding Horse 的架构核心是 "编排引擎 + 上下文管理",JSON‑LD 编译成 DAG 完美地嵌入了这两个核心。
graph LR Orchestrator"编排引擎 SA" ContextEngine"上下文管理引擎" subgraph DAGPipeline"DAG 编译管道" JSONLD"JSON‑LD 图查询" DAG"DAG 生成" PERSIST"写入 L2 黑板" end subgraph Execution"执行层" PA"PA 审查计划" DA"DA 按 DAG 执行" CA"CA 按 DAG 节点校验" end Orchestrator --> JSONLD JSONLD --> DAG DAG --> ContextEngine ContextEngine -->|"注入 DAG 摘要 + IRI"| PA PA -->|"修正 DAG"| PERSIST PERSIST --> DA DA --> CA

  • 编排引擎:SA 直接读取编译出的 DAG,决定执行拓扑和资源分配。
  • 上下文引擎:把 DAG 的当前状态(哪些节点已完成、哪些阻塞)以及相关 IRI 注入给每个 Agent,而不是注入冗长的计划文本。

这种设计让计划和执行彻底分离,计划是"图数据",执行是"状态机"。


五、总结

把 JSON‑LD 编译成 DAG,本质上是在 Agent OS 里装了一个"编译器"。

它把人类意图(5W2H)和技能网络(Skill Graph)编译 成可以被 Agent 直接执行的字节码(DAG)

这带来了几个关键飞跃:

  • 计划从"自然语言"变成"结构化数据",可验证、可增量、可追溯。
  • 调度器有了精确的执行地图,而不是盲猜。
  • 上下文只存 DAG 的摘要和 IRI,Token 成本降到极致。
  • 跨阶段协作传递的是结构化契约,而不是文本文档。

如果你也在构建复杂的 Agent 系统,我强烈建议:不要让 Agent 输出"计划文档",让它输出"DAG"。

这是让你的平台从"聪明但不可靠"走向"可依赖工程"的关键一步。


我这套系统叫 Gliding Horse(流马) ,所有代码都在 GitHub 上:https://github.com/doiito/gliding_horse

欢迎来 star、提 issue、一起把 Agent OS 的理念推得更远。


摘要:本文深入解析了如何将 JSON‑LD 语义网络编译成 DAG(有向无环图),从而让 AI Agent 平台拥有可计算、可验证、可增量更新的任务执行蓝图。基于 Gliding Horse(流马)Rust Agent OS 的实战经验,展示了从 SPARQL 图遍历到 DAG 拓扑排序的完整编译流程,以及四大核心优势:计划结构化、Token 成本骤降、动态调度地图化、跨阶段契约传递。适合 AI 架构师、Agent 系统开发者、知识图谱工程师阅读。

关键词:JSON‑LD 编译 DAG、Agent 操作系统、AI Agent 计划编排、语义网络 DAG、Gliding Horse 流马、SPARQL 图遍历、Rust Agent OS、任务 DAG 生成、Token 优化、可计算任务结构

相关推荐
jump_jump4 小时前
为了重玩金庸群侠传,我研究了一下 Ruffle 怎么复活 Flash
游戏·rust·github
xiezhr7 小时前
折腾半小时,终于让AI 能直接帮我写飞书文档了
ai·飞书·ai agent·飞书cli·飞书文档
岳小哥AI7 小时前
Claude Fable和Claude Mythos 5同时发布:注意力机制下愈加强大的AI大模型
ai·ai基础
Artech7 小时前
[MAF预定义的AIContextProvider-04]Mem0Provider——长期记忆基于的云端解决方案
ai·agent·maf·aicontextprovider·chathistorymemoryprovider·mem0provider
哥不是小萝莉17 小时前
一文读懂 OpenAI Codex 源码的原理、架构与未来
ai
AlfredZhao1 天前
AI 编程工作总结:从体验问题到模块能力建设
ai·codex
星栈1 天前
Dioxus 多页面怎么做:`dioxus-router`、嵌套路由、`Outlet` 和页面组织,一篇给你讲顺
前端·rust·前端框架
cup112 天前
[技术复盘] Windows Python 打包实战:Nuitka 环境踩坑总结与 CI 自动化构建全指南
python·ai·环境变量·ci·nuitka·skill
IT王师傅2 天前
从 豆包 到 Codex CLI:一名普通开发者的 AI 工具进化路线
ai·codex cli·openclaw