【Agent智能体10 | 反思设计模式-AI数据分析的可视化实战】

声明：本篇博客是以吴恩达的【Agent智能体】教程为基础，并对其中的内容做了笔记整理以及个人收获的总结。

上一篇【Agent智能体9 | 反思设计模式-提示词工程的进阶法则】主要是聚焦提示词工程，讨论了如何写好的提示词（例如：多给几个样本，给出审查标准等），来让语言模型进行自我反思。

这篇主要是用了一个更为复杂的例子（可视化咖啡销量），视角切换到了智能体工作流（ agentic workflow）方面，且引入了多模型协作的例子，通过这个例子，你可以肉眼可见地感受到，引入反思机制后，AI 输出结果的惊人进化！

输入数据： 一份包含日期（date）、价格（price）和咖啡名称（coffee_name）的原始表格数据
用户需求： "创建一个图表，比较 2024 年和 2025 年第一季度（Q1）的咖啡销量" (Create a plot comparing Q1 coffee sales in 2024 and 2025)。

分析： 如果只是简单地把这个需求丢给普通的 LLM，它可能会写出一段能运行但图表效果很差的代码。智能体工作流就是为了解决这个问题。

整个流程展示了 AI 如何通过"迭代"来完成任务：

步骤 1：初次生成 (Write python code) 用户输入提示词后，LLM 首先生成了第一版 Python 代码（V1 code），利用 pandas 和 matplotlib 处理数据并绘图。
步骤 2：执行并输出 (Execute V1 code) 系统在后台运行这段代码，生成了第一版图表（plot.png）。可以看到，左下角的第一版图表是一个"堆叠柱状图"。这种图表虽然没有明显的语法错误，但很难让人直观地对比不同咖啡在两年的销量变化，阅读体验很差。
步骤 3：反思与批评 (Critique image, update code) 这是智能体工作流的关键！ 系统并没有直接把第一版图表交给用户，而是将生成的图表和代码再次交给 LLM 进行审查。LLM 发现图表不够清晰，于是修改了代码（生成 V2 code）。
步骤 4：再次执行得到最终结果 (Execute new code) 运行第二版代码后，得到了右下角的新图表（plot_v2.png）。这变成了一个"分组柱状图"，将 2024 和 2025 年的数据并列放置，清晰明了地展示了每种咖啡的销量对比

模型 1（生成器 - Code generation）： 负责根据用户的提示词写出第一版基础代码。
- 提示词： "编写 Python 代码生成可视化图表以回答用户的问题 {用户提示词}"
模型 2（审查员 - Reflection）： 负责扮演"质检员"。可以是同一个模型，也可以是一个能力更强、专门用于分析不同视角的其他 LLM。系统会将第一版代码、生成的图片以及对话历史发给它。
- 提示词： "你是一位专家级数据分析师，负责提供建设性的反馈。第一步：审查附带的图表的可读性、清晰度和完整性。第二步：编写新代码来落实你的改进建议。"

这样充分利用不同LLM的优势，可以得到质量更高的结果！

这套流程展示了 Agentic Workflow（智能体工作流） 相较于传统的 Zero-shot（零样本一次性生成） 的巨大优势

但是，反思在一些应用上提升有限：在另一些应用上提升明显，还有些应用几乎没有提升。不过了解反思对应用影响是很有帮助的。下篇文章将简单讲述评估反射的一些方式。

如果这篇文章对你有帮助，欢迎点赞、评论、关注、收藏。你们的支持是我前进的动力！