构建"可长期运行、可审计、可复用"的智能体系统。
状态机(LangGraph) + 技能包(Skills) + 执行层(Shell)"的三层架构组合。
-
工作流持久化(Survive):确保 Agent 在崩溃、重启后能断点续跑,而非从头开始(LangGraph Checkpoint)。
-
能力模块化(Compose):将庞大的系统拆解为 Skills(技能包),实现"按需加载",避免提示词膨胀。
-
执行确定性(Control):在金融/报关场景下,确保相同的输入产生完全一致的输出,防止模型"自由发挥"(Shell 工具 + 结构化输出)。
-
状态可回溯(Audit):满足深圳金融合规,能随时回放任意步骤的决策快照(State Snapshot)。
-
成本可控(Optimize):通过服务端压缩(Compaction)自动修剪噪音历史,而非粗暴截断。
P0 级:生存基石(防崩 & 防篡改)
目标:确保 Agent 不因重启而丢失进度,且不越权操作。
》》 持久化 (Survive): LangGraph Checkpointer:将状态(State)保存至 SQLite/Redis。中断/人工审核后通过 "thread_id" 从断点恢复,而非从头开始。
》》 确定性 (Control) :OpenAI Shell 工具:将核心逻辑(如汇率计算)封装在 Shell 脚本中,Agent 只负责调用,不负责"思考"算术。 避免模型在产生幻觉,确保结果正确和一致。
P1 级:性能与复用(降本 & 解耦)
》》 模块化 (Compose) 拆分为独立skill,采用 "SKILL.md" 格式。Agent 只预加载技能"目录",触发时才加载完整内容。
》》 成本优化 (Optimize) :服务端压缩 (Compaction):利用 OpenAI Responses API 的自动压缩功能,将冗长对话压缩为"关键决策摘要"。 长流程会话中,自动丢弃无关寒暄,保留关键业务状态。
P2 级:风控(审计 & 回溯)
目标:满足留痕要求,支持问题复盘。
》》 状态回溯 (Audit) State Snapshot + DAG:在关键节点(如支付确认)保存完整的 State 快照,并记录 DAG 执行路径。 复盘时,可精准回放"某任务节点在某时的审核决策过程"。
》》 护栏强化 双层网络白名单:组织级白名单 + 请求级策略,配合 "domain_secrets" 隐藏真实 API Key。 防止 Agent 访问非法外链。