论文推荐 |【Agent】自动化Agent设计系统

论文标题:

Automated Design of Agentic Systems

论文地址:

https://arxiv.org/abs/2408.08435

GitHub地址:

https://github.com/ShengranHu/ADAS

自动化代理设计在性能和通用性方面显著超越了手动方法。

• 引入了自动化代理系统设计(ADAS),这是一个新的研究领域,用于自动创建强大的代理系统设计

• 以代码形式表示代理,使元代理能够编程出越来越优秀的代理

• 提出元代理搜索算法:

  • 基于不断演进的先前发现档案,迭代生成新的代理

  • 利用基础模型创建代理、评估性能并优化设计

• 涵盖包含代理系统所有可能组件的搜索空间:

  • 提示

  • 工具使用

  • 控制流程

• 理论上能够发现任何可能的代理系统

结果📊:

• 在多个领域超越了最先进的手动设计代理

• 在阅读理解任务(DROP)上将F1分数提高了13.6/100

• 在数学任务(MGSM)上将准确率提高了14.4%

• 展示了强大的迁移能力:

  • 在领域迁移后,GSM8K任务的准确率提高了25.9%

  • 在领域迁移后,GSM-Hard任务的准确率提高了13.2%

• 在跨不同领域和模型迁移时仍保持卓越性能

相关推荐
Jurio.3 分钟前
Conda 管理项目环境
人工智能·python·深度学习·conda·virtualenv·pip
曼城周杰伦15 分钟前
自然语言处理:第六十二章 KAG 超越GraphRAG的图谱框架
人工智能·pytorch·神经网络·自然语言处理·chatgpt·nlp·gpt-3
Donvink18 分钟前
多模态大语言模型——《动手学大模型》实践教程第六章
人工智能·深度学习·语言模型·自然语言处理·llama
Joyner201836 分钟前
pytorch训练的双卡,一个显卡占有20GB,另一个卡占有8GB,怎么均衡?
人工智能·pytorch·python
我爱学Python!36 分钟前
解决复杂查询难题:如何通过 Self-querying Prompting 提高 RAG 系统效率?
人工智能·程序人生·自然语言处理·大模型·llm·大语言模型·rag
AI视觉网奇38 分钟前
pytorch3d linux安装
linux·人工智能·pytorch
OBOO鸥柏1 小时前
OBOO鸥柏28.6寸液晶广告屏:创新技术引领智能显示新时代
人工智能·科技·大屏端·广告一体机
封步宇AIGC1 小时前
量化交易系统开发-实时行情自动化交易-4.2.1.简单移动平均线实现
人工智能·python·机器学习·数据挖掘
懒笑翻1 小时前
Python 使用 Selenuim进行自动化点击入门,谷歌驱动,以百度为例
运维·selenium·自动化
n***85941 小时前
Github 开源 10K Stars 自动化 API、后台作业、工作流和 UI 的开发平台
运维·自动化