Immersion in the GitHub Universe: Scaling Coding Aents to Mastery近年来,基于大语言模型(LLM)的代码智能体因其在处理复杂软件工程(SWE)任务方面所展现出的潜力而受到广泛关注(Anthropic, 2025a; Google, 2025; OpenAI, 2025),这一趋势在 SWE-bench(Jimenez et al., 2023)及其后续基准测试(Zhang et al., 2025)中得到了充分体现。然而,这些智能体的进一步发展从根本上受制于高质量训练数据的匮乏。与常规代码生成任务不同,软件工程任务要求智能体在可执行环境中运作,需要其在现有代码库中进行导