【Agent智能体22 | 构建AI工作流的技巧-延迟、成本优化】

声明:本篇博客是以吴恩达的【Agent智能体】教程为基础,并对其中的内容做了笔记整理以及个人收获的总结。

延迟、成本优化的优先级一般较低。下面展示一下相关的思路:

降低延迟

如果你想优化智能体工作流的延迟,常用的方法是对工作流进行基准测试或计时,通过查看整体时间线 我可以判断哪些环节有最大优化空间,可以加快速度,常用的方法如下:

  • 考虑并行处理 (Consider parallelism?)
    • 如果有些步骤还没并行处理,比如网页抓取,可以考虑将部分操作并行执行,而不是排队挨个抓取,从而大幅缩短总运行时间。
  • LLM 步骤耗时过长? (LLM steps too long?)
    • 或者发现某些大语言模型步骤耗时过长,尝试使用规模较小/稍弱但速度更快的模型 (smaller/less intelligent model) ,或者更换响应速度更快的 LLM 服务提供商 (faster LLM provider)

通过这种计时分析 你能判断哪些环节最值得优化

减少成本

在构建和运行 AI 工作流时,通常需要为以下三类操作付费:

  1. LLM 步骤 (LLM steps - pay per token): 调用大语言模型(如 GPT-4、Gemini 等)的费用。这是基于输入(Prompt)和输出(生成的文本)的词块数量 (Token) 来计费的。处理的文本越长,费用越高。
  2. API 调用工具 (Any API-calling tools - pay per API call): 当代理使用外部工具(如谷歌搜索 API、天气 API、数据库查询等)时,通常是按调用次数 (per API call) 固定计费的。
  3. 计算步骤 (Compute steps - based on server capacity/cost): 在本地或云服务器上执行普通代码、数据处理或运行脚本的成本。这取决于所消耗的服务器计算资源和时长

在优化成本方面,同样可以对每一步的成本进行计算 从而基准测试并决定哪些步骤需要优化,重点关注优化哪些环节。

有时候优化提示词减少无效长文本,或者寻找更便宜的替代 API 工具,能大幅降低整体工作流的运行费用。

总结:

所以发现当成本或延迟成为问题时,只需测量每一步的成本或延迟这通常能为你提供依据 判断该优先优化哪些组件

到此,构建AI工作流的技巧相关的知识就介绍完了,下面该介绍"规划"这个涉及模式了!

如果这篇文章对你有帮助,欢迎点赞、评论、关注、收藏。你们的支持是我前进的动力!

相关推荐
冬奇Lab18 小时前
Workflow 系列(01):基础理论——三种执行模型与 Anthropic 5 种模式
人工智能·agent·工作流引擎
冬奇Lab18 小时前
每日一个开源项目(第143篇):page-agent - 纯 JS 的网页 GUI Agent,无需截图、无需插件、无需后端
前端·人工智能·agent
程序员cxuan20 小时前
虽迟但到!GPT-5.6 终于来了!
人工智能·后端·程序员
ZhengEnCi1 天前
Q03-UI设计进阶技巧-让界面更高级的7个核心原则
人工智能
IT_陈寒1 天前
React的这个渲染问题连官方文档都没说清楚
前端·人工智能·后端
不加辣椒1 天前
第12章 工具调用与 Agent 提示工程
人工智能
用户1693176172661 天前
前端给AI消息做日期分组与时间线
人工智能
i晟1 天前
Claude Code Harness 深度拆解:从你敲回车到模型回复,中间发生了什么
人工智能
用户252736278141 天前
【踩坑复盘】我在本地跑 RAG 知识库时踩了 5 个大坑,吐血整理避坑指南
人工智能
大模型真好玩1 天前
LangChain DeepAgents 速通指南(九)—— 生产级智能体框架 DeepAgents Code 源码导读
人工智能·langchain·agent