摘要、压缩与处理大工具输出的工程实践

摘要、压缩与处理大工具输出的工程实践------从 Manus 的经验,看 Context Engineering 的"高风险区"


引言:压缩的不可逆风险与工程对策

上下文压缩是AI Agent工程中的高风险操作------它是有损且不可逆的。一旦关键信息在压缩过程中丢失,系统将无法恢复,可能导致后续决策链条的全面偏差。

Manus联合创始人Peak Ji提出的核心方法论:高质量的摘要不是让模型"写摘要",而是让模型"填表格";处理大工具输出不是无脑透传,而是场景化的策略选择。这一工程实践为我们提供了确保信息保真度的系统化路径。


第一部分:高质量摘要的秘诀------从创作到抽取

1.1 错误做法:开放式指令的不可控性

arduino 复制代码
"请总结以下内容..."

核心问题

  • 信息覆盖不确定:模型可能遗漏工程师认为关键的信息
  • 输出稳定性低:相同输入多次调用结果不一致
  • 下游可解析性差:自然语言输出难以被程序消费
  • 错误定位困难:无法精确知道"哪里漏了"

1.2 正确做法:Schema约束的信息抽取

css 复制代码
定义结构化表单,让AI精确填充字段:
​
┌─────────────────────────────────────────┐
│              Task Summary               │
├─────────────────────────────────────────┤
│ 用户原始目标        │ [必须] 原文核心诉求  │
│ 当前子目标          │ [必须] 当前聚焦任务  │
│ 已修改文件          │ [可选] 文件路径列表  │
│ 已做关键决策        │ [必须] 决策+理由     │
│ 当前阻塞点          │ [必须] 无/具体问题   │
│ 下一步明确行动      │ [必须] 可执行步骤    │
└─────────────────────────────────────────┘

范式转移的本质

维度 自由摘要(创作) Schema填表(抽取)
问题类型 语言生成(Generative) 信息抽取(Extractive)
信息覆盖 不确定 强制覆盖(字段必填)
输出稳定性 高(结构固定)
下游可解析性 极强(结构化数据)
版本演进 不可控 可演进(Schema显式变更)
错误定位 困难 精确(字段级监控)

Schema的工程价值

"Schema本身,就是系统'认为重要的事实集合'"

  • 显式编码业务知识:哪些信息对系统决策至关重要
  • 建立确定性契约:工程师与模型之间的可靠接口
  • 支撑版本化迭代:业务变化时Schema显式变更,变更可追溯

第二部分:处理大工具输出的双策略

当工具返回海量Token时, "完整返回"与"即时处理"存在根本张力。Peak提出场景化的策略选择框架。

2.1 策略选择的决策边界

复制代码
开始
  │
  ├── 工具输出经预处理后长度 < 阈值(如4K tokens)?
  │   └── 否 → 强制预摘要或子Agent封装(策略二)
  │   └── 是 → 继续判断
  │
  ├── Agent需要立即处理(非暂存备用)?
  │   └── 否 → 立即卸载到文件系统,返回指针
  │   └── 是 → 策略一:先完整返回 + 保险措施
  │
  └── 信息时效性高(延迟处理会贬值)?
      └── 否 → 考虑批量异步处理
      └── 是 → 确认策略一

关键认知 :策略一的"完整返回"是有边界的,不是无脑透传原始输出。

2.2 策略一:简单搜索------先完整返回,必须加保险

适用条件(三者缺一不可):

  • 工具输出经预处理后长度可控(< 4K tokens)
  • Agent极有可能立即处理
  • 信息时效性高

三层过滤机制

yaml 复制代码
Layer 1: 工具层预处理(必须)
├── 爬虫:只取正文,去广告/导航/页脚
├── 搜索:只取Top-K(如10条),非全部1000条
└── 数据库:分页+字段筛选,非SELECT *
​
Layer 2: 策略决策
└── 预处理后长度 < 阈值 → 进入策略一
​
Layer 3: 系统级压缩(未来时刻)
└── 原始结果 → 压缩为指针(但关键洞见已保险持久化)

保险措施:对冲"延迟压缩"的不确定性

arduino 复制代码
风险场景:
  完整返回 → Agent还未处理 → 系统提前压缩(因窗口压力)→ 信息丢失
​
保险机制:
  完整返回 → Agent立即提取洞见 → 主动write工具写入文件
              └── 即使原始信息被提前压缩,洞见已安全
​
关键设计:指示模型"立即提取并持久化关键认知",而非保存完整原文

保险措施的写入内容

场景 写入内容
搜索返回10篇论文 "3篇核心论文+各自贡献+与当前任务相关性"
数据库查询结果 "统计摘要+异常点+需要深入调查的ID列表"
API返回监控数据 "关键指标变化+阈值告警+建议排查方向"

2.3 策略二:复杂搜索------子Agent作为工具

适用场景

  • 需要多次查询并整合信息
  • 输出经预处理后仍超长
  • 复杂性超出主Agent即时处理能力

架构设计

scss 复制代码
主Agent上下文(干净、高效)
├── 调用:advanced_search("AI Agent上下文工程最新进展")
│       ↓
│   ┌─────────────────────────────────────┐
│   │         子Agent(独立工作流)         │
│   │  • 自主决定搜索策略(多源、多轮)      │
│   │  • 内部完成整合、去重、验证           │
│   │  • 输出:固定Schema的结构化结果        │
│   └─────────────────────────────────────┘
│       ↓
└── 接收:{热点话题, 关键数据, 趋势判断, 信息来源}
​
效果:主Agent上下文极其干净,复杂性完全封装

策略对比

维度 策略一:先完整返回 策略二:子Agent封装
调用次数 1次(即时) 多次(子Agent内部)
延迟特性 即时响应 有延迟
主Agent上下文 临时膨胀,后压缩 始终干净
信息保真度 依赖保险措施 子Agent内部保障
工程复杂度 高(需设计子Agent)

第三部分:关键工程决策------为何简单搜索不立即卸载

3.1 两种模式的成本对比

模式 流程 调用次数 延迟 适用场景
立即卸载 search→卸载→指针→read_file→内容→处理 2次 复杂查询,非即时处理
先返回原文 search→内容→立即处理 1次 简单搜索,即时决策

3.2 工程决策原则

"对于那些Agent极有可能需要立即处理的工具结果,选择先返回原文来换取宝贵的即时效率" ------ Peak Ji

核心权衡

  • 效率优先:简单搜索的即时性价值高于卸载的安全性
  • 风险对冲:保险措施(主动写入)弥补压缩时机的不确定性
  • 场景分离:复杂任务用子Agent封装,简单任务用策略一快速处理

第四部分:与WSCI框架的融合

Manus实践与LangChain WSCI框架的深度对应:

Manus实践 WSCI操作 作用
Schema结构化摘要 Write(写入) 抢占式持久化关键信息
工具层预处理(Top-K、筛选) Select(选择) 前置过滤,控制输入规模
延迟压缩 + 保险措施 Compress + Write 效率与保真度的平衡
子Agent封装复杂性 Isolate(隔离) 上下文空间隔离,主Agent保持干净

关键洞察 :保险措施本质是在Compress之前preemptively执行Write,确保关键信息在压缩发生前已安全持久化。


结语:工程智慧的本质

Peak Ji的方法论揭示了AI Agent工程的核心原则:

markdown 复制代码
1. 摘要不是创作,是抽取 ------ 用Schema约束确保保真度
2. 压缩有风险,主动写入来对冲 ------ 用机制设计防丢失
3. 场景决定策略 ------ 没有银弹,只有权衡
4. 复杂性要封装 ------ 子Agent隔离,主Agent保持干净
5. 效率与安全的平衡 ------ 即时性价值高时,用保险措施对冲风险

这些"充满权衡的工程智慧",正是从Demo走向生产系统的关键能力。

结语:真正的难点不在技术,而在取舍

摘要、压缩、大工具输出,本身都不复杂。 真正难的是:

在效率、成本、上下文干净度、信息保真之间, 做清醒、可解释、可复盘的工程选择。

Manus 的经验给了我们几个极其重要的原则:

markdown 复制代码
1. 摘要不是创作,是抽取 ------ 用Schema约束确保保真度
2. 压缩有风险,主动写入来对冲 ------ 用机制设计防丢失
3. 场景决定策略 ------ 没有银弹,只有权衡
4. 复杂性要封装 ------ 子Agent隔离,主Agent保持干净
5. 效率与安全的平衡 ------ 即时性价值高时,用保险措施对冲风险

当 Agent 从 Demo 走向生产系统, Context Engineering 本身,就成了一门架构设计学。


参考资源

  1. Manus技术分享(Peak Ji):摘要、压缩与处理大工具输出的技巧
  2. LangChain Context Engineering Best Practices
  3. 《上下文工程:构建高性能AI Agent的系统性架构设计》
相关推荐
是枚小菜鸡儿吖10 小时前
CANN 算子性能瓶颈破解:AIGC 生成优化建议方案
aigc
猿小羽11 小时前
AIGC 应用工程师(3-5 年)面试题精讲:从基础到实战的系统备战清单
面试·大模型·aigc·agent·rag
ujainu小11 小时前
CANN仓库内容深度解读:昇腾AI生态的基石与AIGC发展的引擎
人工智能·aigc
盛夏光年爱学习11 小时前
上下文工程:构建高性能AI Agent的系统性架构设计
aigc
Dimpels12 小时前
CANN ops-nn 算子解读:AIGC 批量生成中的 Batch 处理与并行算子
开发语言·aigc·batch
山顶夕景13 小时前
【MLLM】nano-banana绘图
大模型·aigc·多模态
永远都不秃头的程序员(互关)13 小时前
基于CANN的ops-signal仓库实现AIGC音频生成中的动态窗函数融合优化——从STFT预处理到端到端低延迟合成
aigc·音视频
是枚小菜鸡儿吖13 小时前
从 0 到 1 生成自定义算子:CANN + AIGC 的自动化工作流
运维·自动化·aigc
种时光的人13 小时前
CANN生态场景化部署:cann-deployer实现AIGC大模型一键落地
aigc