论文推荐 |【Agent】自动化Agent设计系统

论文标题:

Automated Design of Agentic Systems

论文地址:

https://arxiv.org/abs/2408.08435

GitHub地址:

https://github.com/ShengranHu/ADAS

自动化代理设计在性能和通用性方面显著超越了手动方法。

• 引入了自动化代理系统设计(ADAS),这是一个新的研究领域,用于自动创建强大的代理系统设计

• 以代码形式表示代理,使元代理能够编程出越来越优秀的代理

• 提出元代理搜索算法:

  • 基于不断演进的先前发现档案,迭代生成新的代理

  • 利用基础模型创建代理、评估性能并优化设计

• 涵盖包含代理系统所有可能组件的搜索空间:

  • 提示

  • 工具使用

  • 控制流程

• 理论上能够发现任何可能的代理系统

结果📊:

• 在多个领域超越了最先进的手动设计代理

• 在阅读理解任务(DROP)上将F1分数提高了13.6/100

• 在数学任务(MGSM)上将准确率提高了14.4%

• 展示了强大的迁移能力:

  • 在领域迁移后,GSM8K任务的准确率提高了25.9%

  • 在领域迁移后,GSM-Hard任务的准确率提高了13.2%

• 在跨不同领域和模型迁移时仍保持卓越性能

相关推荐
Jackson@ML20 分钟前
一分钟了解大语言模型(LLMs)
人工智能·语言模型·自然语言处理
让学习成为一种生活方式23 分钟前
大麦(Hordeum vulgare)中 BAHD 超家族酰基转移酶-文献精读129
人工智能
思茂信息26 分钟前
CST软件对OPERA&CST软件联合仿真汽车无线充电站对人体的影响
c语言·开发语言·人工智能·matlab·汽车·软件构建
墨绿色的摆渡人30 分钟前
pytorch小记(二十):深入解析 PyTorch 的 `torch.randn_like`:原理、参数与实战示例
人工智能·pytorch·python
lqjun082732 分钟前
Pytorch实现常用代码笔记
人工智能·pytorch·笔记
qyhua33 分钟前
用 PyTorch 从零实现简易GPT(Transformer 模型)
人工智能·pytorch·transformer
白熊1881 小时前
【计算机视觉】OpenCV项目实战:基于face_recognition库的实时人脸识别系统深度解析
人工智能·opencv·计算机视觉
桃花键神1 小时前
华为云Flexus+DeepSeek征文|基于Dify平台tiktok音乐领域热门短视频分析Ai agent
人工智能·华为云
几道之旅1 小时前
mAP、AP50、AR50:目标检测中的核心评价指标解析
人工智能·目标检测·目标跟踪
英英_1 小时前
python 自动化教程
开发语言·python·自动化