论文推荐 |【Agent】自动化Agent设计系统

论文标题:

Automated Design of Agentic Systems

论文地址:

https://arxiv.org/abs/2408.08435

GitHub地址:

https://github.com/ShengranHu/ADAS

自动化代理设计在性能和通用性方面显著超越了手动方法。

• 引入了自动化代理系统设计(ADAS),这是一个新的研究领域,用于自动创建强大的代理系统设计

• 以代码形式表示代理,使元代理能够编程出越来越优秀的代理

• 提出元代理搜索算法:

  • 基于不断演进的先前发现档案,迭代生成新的代理

  • 利用基础模型创建代理、评估性能并优化设计

• 涵盖包含代理系统所有可能组件的搜索空间:

  • 提示

  • 工具使用

  • 控制流程

• 理论上能够发现任何可能的代理系统

结果📊:

• 在多个领域超越了最先进的手动设计代理

• 在阅读理解任务(DROP)上将F1分数提高了13.6/100

• 在数学任务(MGSM)上将准确率提高了14.4%

• 展示了强大的迁移能力:

  • 在领域迁移后,GSM8K任务的准确率提高了25.9%

  • 在领域迁移后,GSM-Hard任务的准确率提高了13.2%

• 在跨不同领域和模型迁移时仍保持卓越性能

相关推荐
Scc_hy2 分钟前
强化学习_Paper_1988_Learning to predict by the methods of temporal differences
人工智能·深度学习·算法
袁煦丞5 分钟前
【亲测】1.5万搞定DeepSeek满血版!本地部署避坑指南+内网穿透黑科技揭秘
人工智能·程序员·远程工作
大模型真好玩7 分钟前
理论+代码一文带你深入浅出MCP:人工智能大模型与外部世界交互的革命性突破
人工智能·python·mcp
遇码21 分钟前
大语言模型开发框架——LangChain
人工智能·语言模型·langchain·llm·大模型开发·智能体
在狂风暴雨中奔跑21 分钟前
使用AI开发Android界面
android·人工智能
飞哥数智坊22 分钟前
AI编程实战:30分钟实现Web 3D船舶航行效果
人工智能·three.js
誉鏐25 分钟前
从零开始设计Transformer模型(1/2)——剥离RNN,保留Attention
人工智能·深度学习·transformer
Ai野生菌27 分钟前
工具介绍 | SafeLLMDeploy教程来了 保护本地LLM安全部署
网络·人工智能·安全·大模型·llm
契合qht53_shine32 分钟前
OpenCV 从入门到精通(day_05)
人工智能·opencv·计算机视觉
3DVisionary40 分钟前
3D-DIC与机器学习协同模拟材料应力-应变本构行为研究
人工智能·机器学习·3d·3d-dic技术 机器学习·应力-应变本构行为·卷积神经网络(ecnn)·数字图像相关法(dic)