概述
近年来,基于大规模语言模型(LLM)构建自主代理系统备受关注,但传统方法依赖于预先定义的代理模板,存在灵活性和可扩展性问题。在此背景下,本文提出了一个名为 "SwarmAgentic "的新框架。该方法只需将任务描述和目标函数作为输入,就能在结构化的自然语言空间中全自动生成、优化和改进代理的协调结构。
该方法的一个显著特点是基于语言对粒子群优化(PSO)进行了重组,粒子群优化是一种群集智能,其中结构化代理系统被视为粒子。每个粒子都有一个用自然语言描述的代理配置和协调策略,并使用 LLM 进行迭代改进。因此,所提出的方法在复杂的实际任务(如旅行规划、行程协调和创意任务)中取得了很高的性能,明显优于以前的方法。
建议的方法
SwarmAgentic 是一个全自动框架,它以自然语言构建代理系统,并将其作为优化目标。其基本单位是 "粒子",每个粒子由一组代理配置和协作工作流程组成。首先,在初始化阶段,使用 LLM 生成各种粒子。这包括由温度参数控制的搜索范围,从保守配置到创新配置不等。
优化通过 "故障感知速度更新"(Failure-Aware Velocity Update)实现,它使用基于故障的流量反馈。更新从失败中学习,并根据与自身最佳配置(个人最佳配置)和全群最佳配置(全局最佳配置)的比较,生成改进配置的方向。这样,微粒就能在句子层面重新配置自己的角色定义和协调策略,从而提高解决方案的质量。
位置更新(Position Update)通过句子结构转换来修改实际的代理配置和工作流程。通过这一系列过程,SwarmAgentic 能够生成自主优化的代理系统,同时兼顾配置的适应性和可解释性。
实验
为了测试 SwarmAgentic 的有效性,我们在六个现实的、结构限制较少的任务上进行了实验,包括旅行计划(TravelPlanner)、行程协调(NaturalPlan)、创意写作(Creative Writing)和数学推理(MGSM)。基线是一项标准的直接形式任务。基线包括标准的直接提示(Direct)、思维链(CoT)和自我修正的自我定义,以及现有的自动生成方法,如 EvoAgent 和 ADAS。
结果,在 TravelPlanner 任务中,SwarmAgentic 比 ADAS 提高了 261.8%,在所有任务中的准确率最高。特别是在创建任务中,我们还观察到,增加粒子数量和迭代次数可显著提高输出的一致性和主题性。
此外,一项可视化合成优化中期过程的分析表明,随着质量保证专家的引入和协作流程的调整,成功率逐步提高,这证明了 SwarmAgentic 的进化过程是有序和可解释的。这些结果表明,不依赖模板的全自动代理设计在实际任务中非常有效。