技术栈
gaia
HuggingFace
6 个月前
agent
·
智能体
·
gaia
GAIA: 一个严苛的智能体基准
经过一些实验,我们对 Transformers 智能体构建智能体系统的性能印象深刻,因此我们想看看它有多好!我们使用一个 用库构建的代码智能体 在 GAIA 基准上进行测试,这可以说是最困难、最全面的智能体基准测试……最终我们取得了第一名的成绩!