【论文阅读】DARWIN GÖDEL MACHINE: 自我改进智能体的开放式进化

快速了解部分

题目: DARWIN GÖDEL MACHINE: OPEN-ENDED EVOLUTION OF SELF-IMPROVING AGENTS
时间: 2025.05
机构: University of British Columbia, Vector Institute, Sakana AI, Canada CIFAR AI Chair
3个英文关键词: self-improving agents, open-ended evolution, coding agents

提出Darwin Gödel Machine (DGM)，一个能自己改自己代码、用benchmark实证验证改进效果、并通过维护多样化agent档案库实现持续进化的自改进编码系统。

自改进AI可以像科学进步一样累积式发展：用实证验证替代形式证明，用开放式探索替代单线进化，让系统自己积累"垫脚石"，实现真正的自加速创新。

像生物进化：维护一个"物种库"(agent档案)，按"能力强+后代少"的原则选"父母"，让父母"变异"(改自己代码)生出"孩子"，用coding benchmark做"自然选择"，能干活的孩子入库，循环迭代。

Benchmarks: SWE-bench Verified(Python多文件修复), Polyglot(多语言单文件实现)
基础设置: 冻结FM, Bash+edit工具, 单prompt输入
模型: 自修改用Claude 3.5 Sonnet, 评估用Claude 3.5 Sonnet(SWE)或o3-mini(Polyglot)
迭代: 80轮, 并行2-4个任务
结论: SWE-bench 20.0%→50.0%, Polyglot 14.2%→30.7%; 超越无自改进/无开放式探索baseline; 改进可跨模型、跨benchmark、跨编程语言迁移

Schmidhuber (2007) Gödel machines: Fully self-referential optimal universal self-improvers
Hu et al. (2025) Automated Design of Agentic Systems (ADAS)
Robeyns et al. (2025) A Self-Improving Coding Agent

想法很好，通过不断加新的agent并淘汰来实现进化。