【Agent智能体10 | 反思设计模式-AI数据分析的可视化实战】

声明:本篇博客是以吴恩达的【Agent智能体】教程为基础,并对其中的内容做了笔记整理以及个人收获的总结。

上一篇【Agent智能体9 | 反思设计模式-提示词工程的进阶法则】主要是聚焦提示词工程,讨论了如何写好的提示词(例如:多给几个样本,给出审查标准等),来让语言模型进行自我反思。

这篇主要是用了一个更为复杂的例子(可视化咖啡销量),视角切换到了智能体工作流( agentic workflow)方面,且引入了多模型协作的例子,通过这个例子,你可以肉眼可见地感受到,引入反思机制后,AI 输出结果的惊人进化!

任务背景:可视化咖啡销量(Visualizing coffee sales)

  • 输入数据: 一份包含日期(date)、价格(price)和咖啡名称(coffee_name)的原始表格数据
  • 用户需求: "创建一个图表,比较 2024 年和 2025 年第一季度(Q1)的咖啡销量" (Create a plot comparing Q1 coffee sales in 2024 and 2025)。

分析: 如果只是简单地把这个需求丢给普通的 LLM,它可能会写出一段能运行但图表效果很差的代码。智能体工作流就是为了解决这个问题。

图表生成的智能体工作流 (Chart generation agentic workflow)

整个流程展示了 AI 如何通过"迭代"来完成任务:

  • 步骤 1:初次生成 (Write python code) 用户输入提示词后,LLM 首先生成了第一版 Python 代码(V1 code),利用 pandasmatplotlib 处理数据并绘图。
  • 步骤 2:执行并输出 (Execute V1 code) 系统在后台运行这段代码,生成了第一版图表(plot.png)。可以看到,左下角的第一版图表是一个"堆叠柱状图"。这种图表虽然没有明显的语法错误,但很难让人直观地对比不同咖啡在两年的销量变化,阅读体验很差。
  • 步骤 3:反思与批评 (Critique image, update code) 这是智能体工作流的关键! 系统并没有直接把第一版图表交给用户,而是将生成的图表和代码再次交给 LLM 进行审查。LLM 发现图表不够清晰,于是修改了代码(生成 V2 code)。
  • 步骤 4:再次执行得到最终结果 (Execute new code) 运行第二版代码后,得到了右下角的新图表(plot_v2.png)。这变成了一个"分组柱状图",将 2024 和 2025 年的数据并列放置,清晰明了地展示了每种咖啡的销量对比

使用不同的 LLM 进行反思(Reflection with a different LLM)

  • 模型 1(生成器 - Code generation): 负责根据用户的提示词写出第一版基础代码。

    • 提示词: "编写 Python 代码生成可视化图表以回答用户的问题 {用户提示词}"
  • 模型 2(审查员 - Reflection): 负责扮演"质检员"。可以是同一个模型,也可以是一个能力更强、专门用于分析不同视角的其他 LLM。系统会将第一版代码、生成的图片以及对话历史发给它。

    • 提示词: "你是一位专家级数据分析师,负责提供建设性的反馈。第一步:审查附带的图表的可读性、清晰度和完整性。第二步:编写新代码来落实你的改进建议。"

这样充分利用不同LLM的优势,可以得到质量更高的结果!

总结

这套流程展示了 Agentic Workflow(智能体工作流) 相较于传统的 Zero-shot(零样本一次性生成) 的巨大优势

但是,反思在一些应用上提升有限:在另一些应用上提升明显,还有些应用几乎没有提升。不过了解反思对应用影响是很有帮助的。下篇文章将简单讲述评估反射的一些方式。

如果这篇文章对你有帮助,欢迎点赞、评论、关注、收藏。你们的支持是我前进的动力!

相关推荐
2601_957879331 小时前
企业矩阵系统建设实践:从账号管理到AI内容协同
大数据·人工智能·矩阵系统·数字化运营
FIT2CLOUD飞致云1 小时前
加强安全防护,图表与仪表板功能优化,DataEase开源BI工具v2.10.23 LTS版本发布
数据分析·开源·数据可视化·dataease·bi
2601_957882241 小时前
矩阵系统在企业内容管理与数字获客中的实践分析
人工智能·矩阵系统·企业数字化运营
霍格沃兹测试学院-小舟畅学1 小时前
接口自动化测试的下一个十年:从脚本到Skills,让AI学会“如何测”
java·前端·人工智能
暴躁小师兄数据学院1 小时前
【AI大模型应用开发工程师特训笔记】第04讲(第10章):Python 高阶编程
人工智能
T_Wang_Lab1 小时前
跨领域语义漂移的双视角量化框架:基于知识图谱邻居的Jaccard方法与跨域对齐的Word2Vec方法的系统比较与联合诊断
人工智能·知识图谱·word2vec
Cx330❀2 小时前
【Qt 核心机制篇】深度解析 Qt 信号与槽(Signals & Slots)机制:从底层原理、实战演练到 Lambda 进阶
linux·开发语言·c++·人工智能·qt·ubuntu
碳基硅坊2 小时前
从“几何缩微“到“时间缩微“ 华为韬定律开启芯片演进新赛道
人工智能·韬定律·时间缩微
霸道流氓气质2 小时前
Spring AI Alibaba 学习路线图:从入门到精通
人工智能·学习·spring