Harnessing Claude 打造高效、低成本、可进化的 AI 应用

在 AI 技术飞速迭代的今天,Anthropic 联合创始人 Chris Olah 的一句话道出了生成式 AI 的本质:Claude 这类大模型不是被 "搭建" 出来的,而是被 "培育" 成长的

研究人员设定成长规则,却无法精准预判它会涌现出怎样的能力。这给开发者带来了一个核心难题:我们为 Claude 搭建的智能体框架(Agent Harness),总是基于 "它做不到什么" 的假设,可这些假设会随着 Claude 的进化快速失效

昨天的最优解,可能成为今天的性能瓶颈;曾经为弥补短板设计的逻辑,转眼变成冗余负担

如何让 AI 应用跟上 Claude 的进化速度,同时平衡延迟、成本与体验?Anthropic 官方团队总结出三大黄金开发范式,既是技术指南,更是 AI 应用开发的底层逻辑,读懂就能少走弯路。

一、善用既有能力:别重复造轮子,用好 Claude 天生精通的工具

很多开发者陷入误区:为了实现特定功能,费尽心思为 Claude 开发专属工具,却忽略了它早已熟练掌握的核心能力。

最高效的开发,是依托 Claude 的原生能力搭建应用

2024 年末,Claude 3.5 Sonnet 仅凭两款通用工具 ------bash 命令工具、文本编辑器工具(支持文件查看 / 创建 / 编辑),就在权威软件工程测试 SWE-bench Verified 中拿下 49% 的准确率,登顶当时全球最佳水平,而 Claude Code 正是基于这两款工具打造。

bash 并非为智能体设计,却是 Claude 越用越精通的工具。更关键的是,Claude 能自主组合这些通用工具,衍生出高阶能力:

  • 智能体技能(Agent Skills)

  • 程序化工具调用

  • 记忆工具

这些复杂功能,本质都是 bash 与文本编辑器的组合应用。不用追求 "专属定制",用好模型已吃透的工具,就能实现远超预期的效果

二、停止过度干预:把决策权还给 Claude,减负就是提效

智能体框架的本质,是固化了 "Claude 无法自主完成" 的假设。但随着模型进化,这些假设必须被打破 ------你替 Claude 做的决定越多,越限制它的智能发挥。(个人感受:AI给出的方案,已经远超普通大众给出的方案,也就是之前说的,我们需要用AI实现自己的思想的跃升。)

真正高效的开发,是不断追问:我可以停止做什么?

  • 让 Claude 自主编排操作,告别无效token消耗

传统开发逻辑:所有工具结果都必须传回 Claude 上下文窗口,才能进行下一步。

但这会造成巨大浪费:读取大型表格时,无关数据会占用大量token,耗时又费钱。即便用硬编码过滤,也是框架替 Claude 做了本应由它决定的事。

解决方案 :给 Claude 配备代码执行工具(bash/REPL)。

Claude 能自主编写代码,定义工具调用逻辑,自主筛选、传递、衔接工具结果,无需占用上下文窗口,只有最终执行结果会传入模型。

实测效果惊人:在网页浏览测试 BrowseComp 中,Opus 4.6 凭借自主编排能力,准确率从 45.3% 飙升至 61.6%。代码能力越强,Claude 的通用智能体能力就越出众

  • 让 Claude 自主管理上下文,拒绝注意力浪费

传统做法:人工编写系统提示词,把所有任务指令预加载进去。

弊端:多任务场景下,极少用到的指令会占用 Claude 的 "注意力预算",导致性能下降。

解决方案 :用技能调用 + 上下文编辑 + 子智能体三重能力,让 Claude 自主管理上下文。

  • 技能调用:仅预加载简短描述,需要时再调取完整内容,不浪费token;

  • 上下文编辑:主动清除失效信息,保留核心内容;

  • 子智能体:创建独立上下文,专项任务专项处理。

Opus 4.6 凭借子智能体能力,BrowseComp 成绩再提升 2.8%,真正实现 "精准聚焦,不做无用功"。

  • 让 Claude 自主持久化上下文,长周期任务不再掉线

长周期任务很容易超出上下文窗口限制,传统方案依赖外围检索架构,复杂又低效。

Anthropic 给出极简方案:让 Claude 自己管理记忆。

  • 上下文压缩:自主总结过往内容,保障长任务连贯性;

  • 记忆文件夹:自主写入、读取文件,存储关键信息。

效果差距一目了然:

  • 旧版 Sonnet 3.5 玩《宝可梦》,只会机械记录 NPC 对话,14000 步生成 31 个冗余文件;

  • 新版 Opus 4.6,会自动整理战术笔记,10 个文件归类清晰,还能总结失败经验,游戏进度大幅领先。

从 "机械记录" 到 "策略思考",Claude 的记忆能力,全靠自主掌控实现质变。

三、精准设定边界:框架不限制智能,只守护规则

智能体框架不是 Claude 的 "枷锁",而是用户体验、成本、安全的守护者。无需限制模型能力,只需做好三件事:

  • 最大化缓存命中率,成本直降 90%

Claude 的 API 无状态,每轮交互都需要打包全量上下文,而缓存token成本仅为基础token的 10%

遵循 5 大原则,缓存利用率拉满:

  • 静态内容前置:系统提示、工具说明放最前面;

  • 消息更新:用<system-reminder>追加内容,不修改原提示;

  • 不切换模型:缓存与模型绑定,切换即失效;

  • 谨慎管理工具:增删工具会清空缓存,动态工具用搜索替代;

  • 动态更新断点:多轮交互中,及时移动缓存断点。

小改动大收益,轻松实现 "降本增效"。

  • 声明式工具:划定安全与体验边界

Claude 不懂应用的安全规则和用户交互逻辑,bash 工具权限过大,存在风险。

解决方案:将高风险、高交互操作,转化为专用声明式工具

  • 安全层面:外部 API 调用增设用户确认,文件编辑加入过期校验;

  • 体验层面:用户交互转为弹窗,阻塞智能体等待反馈;

  • 可观测性:结构化参数,方便日志记录、追踪复现。

高风险动作严格管控,常规操作放开发挥,平衡安全与效率。

四、未来启示:AI 应用开发,要学会 "做减法"

Claude 的智能边界一直在拓展,今天的 "能力短板",明天可能就变成 "核心优势"。

Anthropic 团队亲身验证:Sonnet 4.5 存在 "上下文焦虑",接近上限会提前终止任务,团队专门开发了上下文重置功能;可到了 Opus 4.5,这个问题彻底消失,曾经的补救逻辑变成了冗余代码,反而拖累性能。

AI 应用开发的终极智慧,是持续 "做减法"

每一次 Claude 迭代,都要重新审视:哪些假设已经失效?哪些逻辑可以删除?哪些干预可以停止?不要让昨天的解决方案,成为今天的性能瓶颈。

写在最后

驾驭 Claude 的智能,核心不是 "控制它",而是 "成就它":

  • 善用既有能力,不做无用功;

  • 停止过度干预,释放模型潜力;

  • 精准设定边界,平衡效率与安全。

在 AI 快速进化的时代,最好的应用不是 "固化的成品",而是能跟着模型一起成长的生态

掌握这三大范式,你打造的不仅是一款 AI 应用,更是能持续迭代、始终领先的核心竞争力。

相关推荐
枫叶林FYL2 小时前
【Python高级工程与架构实战】项目三:实时数据管道(Kafka + Polars + Delta Lake)(一)
人工智能·机器学习
q_35488851532 小时前
计算机毕业设计:Python居民出行规律可视化分析系统 Django框架 可视化 数据分析 PyEcharts 交通 深度学习(建议收藏)✅
人工智能·python·数据分析·车载系统·django·汽车·课程设计
ai生成式引擎优化技术2 小时前
TSPR-WEB-LLM-HIC (TWLH四元结构)AI 生成式引擎(GEO)
人工智能
云上码厂2 小时前
大模型数学库DeepSeek-Math-V2
人工智能
wxl7812272 小时前
驾驭工程 (Harness Engineering):AI Agent 时代的软件工程新范式
人工智能·软件工程
程序员Shawn2 小时前
【深度学习 | 第四篇】- 循环神经网络
人工智能·rnn·深度学习
33三 三like2 小时前
BERT-BiLSTM-CRF 养老需求实体抽取模型解析与实践:从口语文本到结构化知识
人工智能·深度学习·bert
vx_biyesheji00012 小时前
计算机毕业设计:Python城市交通出行模式挖掘系统 Django框架 可视化 数据分析 PyEcharts 交通 深度学习(建议收藏)✅
人工智能·python·深度学习·数据分析·django·汽车·课程设计
yuanmazhiwu2 小时前
计算机毕业设计:Python智慧出行数据分析与模式识别系统 Django框架 可视化 数据分析 PyEcharts 交通 深度学习(建议收藏)✅
人工智能·python·算法·数据分析·django·flask·课程设计