让 AI 通宵优化神经网络:Karpathy autoresearch 的设计哲学与启示Karpathy 今年 3 月开源的 autoresearch,做了一个极简却有力的实验:把一份 5 分钟训练预算的 nanochat 单 GPU 实现交给 AI 代理,让它自主改代码、跑训练、看指标、提交或回滚,循环往复。一夜之间,~100 次实验跑下来,nanochat 达到 GPT-2 等效水平的耗时从 2.02 小时压缩到 1.80 小时——端到端提速 11%。本文将拆解这套设计背后的关键取舍,并深入探讨它与经典 AutoML / NAS 的本质区别。