论文推荐 |【Agent】自动化Agent设计系统

论文标题:

Automated Design of Agentic Systems

论文地址:

https://arxiv.org/abs/2408.08435

GitHub地址:

https://github.com/ShengranHu/ADAS

自动化代理设计在性能和通用性方面显著超越了手动方法。

• 引入了自动化代理系统设计(ADAS),这是一个新的研究领域,用于自动创建强大的代理系统设计

• 以代码形式表示代理,使元代理能够编程出越来越优秀的代理

• 提出元代理搜索算法:

  • 基于不断演进的先前发现档案,迭代生成新的代理

  • 利用基础模型创建代理、评估性能并优化设计

• 涵盖包含代理系统所有可能组件的搜索空间:

  • 提示

  • 工具使用

  • 控制流程

• 理论上能够发现任何可能的代理系统

结果📊:

• 在多个领域超越了最先进的手动设计代理

• 在阅读理解任务(DROP)上将F1分数提高了13.6/100

• 在数学任务(MGSM)上将准确率提高了14.4%

• 展示了强大的迁移能力:

  • 在领域迁移后,GSM8K任务的准确率提高了25.9%

  • 在领域迁移后,GSM-Hard任务的准确率提高了13.2%

• 在跨不同领域和模型迁移时仍保持卓越性能

相关推荐
金井PRATHAMA34 分钟前
认知语义学隐喻理论对人工智能自然语言处理中深层语义分析的赋能与挑战
人工智能·自然语言处理·知识图谱
J_Xiong011738 分钟前
【VLMs篇】07:Open-Qwen2VL:在学术资源上对完全开放的多模态大语言模型进行计算高效的预训练
人工智能·语言模型·自然语言处理
老兵发新帖1 小时前
LlamaFactory能做哪些?
人工智能
2202_756749691 小时前
LLM大模型-大模型微调(常见微调方法、LoRA原理与实战、LLaMA-Factory工具部署与训练、模型量化QLoRA)
人工智能·深度学习·llama
人有一心1 小时前
深度学习中显性特征组合的网络结构crossNet
人工智能·深度学习
机器之心1 小时前
用光学生成图像,几乎0耗电,浙大校友一作研究登Nature
人工智能·openai
苏苏susuus2 小时前
NLP:Transformer之self-attention(特别分享3)
人工智能·自然语言处理·transformer
猫天意2 小时前
【目标检测】metrice_curve和loss_curve对比图可视化
人工智能·深度学习·目标检测·计算机视觉·cv
山烛2 小时前
OpenCV:图像透视变换
人工智能·opencv·计算机视觉·图像透视变换