
在AI Agent快速发展的今天,如何准确理解和分类不同类型的智能体成为了业界关注的焦点。最近,一个基于工作流(workflow)和上下文(context)两个维度的分类框架引起了广泛讨论,为我们理解AI Agent的能力边界和应用场景提供了清晰的思路。
理解AI Agent的两个核心维度
AI Agent的智能程度可以通过两个关键变量来衡量:控制任务走向的workflow工作流,以及控制内容生成的context上下文。这两个维度的确定性高低,直接决定了Agent的复杂程度和智能化水平。
下面是@Barret李靖的原贴内容:
Agent 有两个变量,一个是控制任务走向的 workflow 工作流,一个是控制内容生成的 context 上下文。
1)如果 workflow 和 context 的确定性都很高,这类任务就容易被自动化,类似传统 RPA,比如在处理发票处理、表单填报任务时,AI 更多是粘合剂,发挥空间比较有限。
2)如果 workflow 确定但 context 不确定,也就是流程固定但输入多变,就需要 Agent 在语义和理解上补全,比如客服问答、合同解析,需要通过外部检索、知识图谱等工具来弥补信息的缺口,让推理结果更符合预期。
3)如果 workflow 不确定但 context 确定,也就是输入清晰但走法多样,Agent 就要去自主规划路径,例如市场分析报告生成、个性化推荐等,大多数 End-to-End RL Agent 都擅长做这类任务,因为它们在训练阶段就习得了大量的路径规划和解题思路。
4)而当 workflow 和 context 都不确定时,就是最复杂的场景了,既要推理也要探索,像创新方案设计、跨部门信息收集等,这类更偏向于通用型 Agent,它的执行效果,取决于给它配备的工具丰富度,尤其是编程能力要最大化开放,例如让它学会去 Github 找仓库克隆并修改代码来解决问题,让它像人一样干活儿。
所以,要把 Agent 做好,首先要明确场景。本质上,自动化解决的是"确定性"问题,而智能化解决的是"不确定性"问题。
感觉这个分类非常不错!下面我们具体展开讲一下四种场景
四种典型的Agent场景分析
高确定性场景:传统自动化的领域
当workflow和context的确定性都很高时,这类任务本质上更接近传统的RPA(机器人流程自动化)。在发票处理、表单填报等标准化任务中,AI更多扮演粘合剂的角色,发挥空间相对有限。这种场景下,完全可以将整个流程包装成一个完整的RPA,Agent只需要识别意图并调用相应的自动化流程即可。
虽然这种方式足够健壮,但在智能化方面显得相对初级,需要在前期就把技术工作人为完善,AI主要起到简单的工具调用功能。
流程固定,输入多变:语义理解的舞台
当workflow确定但context不确定时,也就是流程相对固定但输入内容多变的场景,Agent需要在语义理解和信息补全方面发挥更大作用。客服问答、合同解析等应用就属于这一类别。
在这种情况下,Agent需要通过外部检索、知识图谱等工具来弥补信息缺口,让推理结果更符合预期。但这里也存在挑战,精准引导Agent的语义理解和补全确实很难,大模型输出的不确定性仍然是需要解决的问题。
输入清晰,路径多样:自主规划的考验
当workflow不确定但context确定时,输入信息相对清晰,但解决路径却有多种可能性,这就需要Agent具备自主规划能力。市场分析报告生成、个性化推荐等应用场景都属于这一类别。
大多数端到端强化学习Agent都擅长处理这类任务,因为它们在训练阶段就习得了大量的路径规划和解题思路。这种场景考验的是Agent的规划能力和决策智能。
双重不确定:通用智能的真实挑战
最复杂的场景出现在workflow和context都不确定的情况下,这种场景既需要推理能力也需要探索精神。创新方案设计、跨部门信息收集等任务就属于这一类别,也是最接近通用人工智能真实挑战的场景。
这类Agent更偏向于通用型智能体,执行效果很大程度上取决于为其配备的工具丰富度。编程能力的最大化开放变得尤为重要,比如让Agent学会到GitHub找仓库、克隆并修改代码来解决问题,真正做到像人一样工作。
动态协同:两个维度的相互影响
值得注意的是,workflow和context在真实任务中并非完全独立,而是动态协同的关系。一个强大的Agent,其智能恰恰体现在能够根据context选择或调整workflow。
以客服场景为例,用户问题的细节直接决定了解决路径的分支选择。一个客服Agent在处理复杂问题时,workflow也会变得不确定,可能需要转人工、升级处理,或者创造全新的解决路径。同时,context的丰富度也会反过来影响workflow的复杂程度。
实践中的经验与思考
从实际运行经验来看,不同步骤之间通过文件来互通,步骤内反复确认,直到确认无误后再执行下一步,是一种很好的实践方式。这种方法能够有效控制Agent执行过程中的不确定性。
对于那些能够整理出标准作业程序(SOP)的领域,做好自动化Agent相对容易。但要实现AI自动规划、自动"解题"的期望,还需要在智能化方面继续突破。
从自动化到智能化的本质区别
这个分类框架最核心的洞察在于:自动化解决的是"确定性"问题,而智能化解决的是"不确定性"问题。这一认知为我们理解AI Agent的发展方向提供了重要指导。
要把Agent做好,首先要明确应用场景。不同确定性水平的任务需要不同类型的Agent解决方案,盲目追求通用性可能会导致在具体场景中效果不佳。
结语
随着AI技术的不断发展,我们正在见证从第一代Agent到第二代Agent的演进。基于workflow和context确定性的分类框架,不仅帮助我们更好地理解当前AI Agent的能力边界,也为未来通用人工智能的发展提供了清晰的路线图。
在这个充满不确定性的智能化时代,准确定位Agent的应用场景,合理配置工具能力,将是决定AI Agent成功与否的关键因素。