2025年10月30日 | 安全
现已进入私人测试版:一个像安全研究员一样思考的AI代理,能够扩展以满足现代软件的需求。
今天,我们宣布推出Aardvark,一个由GPT-5驱动的代理安全研究员。
软件安全是技术领域最关键------也是最具挑战性------的前沿之一。每年,企业和开源代码库中都会发现数万个新漏洞。防御者面临着在对手之前发现和修补漏洞的艰巨任务。在OpenAI,我们致力于让这种平衡向有利于防御者的方向倾斜。
Aardvark代表了AI和安全研究的突破:一个自主代理,能够帮助开发者和安全团队大规模发现和修复安全漏洞。Aardvark现已进入私人测试版,以在现场验证和完善其能力。
Aardvark的工作原理
Aardvark持续分析源代码存储库,以识别漏洞、评估可利用性、优先处理严重程度并提出针对性的补丁。
Aardvark通过监控代码库的提交和更改来工作,识别漏洞、它们可能被利用的方式并提出修复方案。Aardvark不依赖于像fuzzing或软件组合分析这样的传统程序分析技术。相反,它使用LLM驱动的推理和工具使用来理解代码行为并识别漏洞。Aardvark像人类安全研究员一样寻找bug:通过阅读代码、分析代码、编写和运行测试、使用工具等等。

Aardvark依赖多阶段管道来识别、解释和修复漏洞:
- 
分析:它首先分析整个存储库,生成反映其对项目安全目标和设计理解的威胁模型。 
- 
提交扫描:它通过检查提交级别的更改与整个存储库和威胁模型来扫描漏洞,当新代码被提交时。当一个存储库首次连接时,Aardvark将扫描其历史记录以识别现有问题。Aardvark逐步解释它发现的漏洞,为人工审查标注代码。 
- 
验证:一旦Aardvark识别出潜在漏洞,它将尝试在隔离的沙盒环境中触发该漏洞以确认其可利用性。Aardvark描述采取的步骤,以帮助确保向用户返回准确、高质量和低误报率的洞察。 
- 
修补:Aardvark与OpenAI Codex集成以帮助修复它发现的漏洞。它为每个发现附加Codex生成且经过Aardvark扫描的补丁,供人工审查和高效的一键式修补。 
Aardvark与工程师并肩工作,与GitHub、Codex和现有工作流程集成,在不减缓开发的情况下提供清晰、可操作的洞察。虽然Aardvark是为安全而构建的,但在我们的测试中,我们发现它也可以发现诸如逻辑缺陷、不完整修复和隐私问题等bug。
真实的当下影响
Aardvark已经服务了几个月,在OpenAI内部代码库和外部alpha合作伙伴的代码库上持续运行。在OpenAI内部,它发现了有意义的漏洞,并为OpenAI的防御态势做出了贡献。合作伙伴强调了其分析的深度,Aardvark发现了只在复杂条件下出现的问题。
在对"黄金"存储库的基准测试中,Aardvark识别了92%的已知和合成引入的漏洞,展示了高召回率和现实世界的有效性。
Aardvark用于开源
Aardvark也已应用于开源项目,在那里它发现并负责任地披露了众多漏洞------其中十个已获得Common Vulnerabilities and Exposures (CVE)标识符。
作为几十年开放研究和负责任披露的受益者,我们致力于回馈------贡献工具和发现,使数字生态系统对每个人来说都更安全。我们计划向选定的非商业开源存储库提供公益扫描,以贡献于开源软件生态系统和供应链的安全性。
我们最近更新了出站协调披露政策,该政策采取了开发者友好的立场,专注于协作和可扩展的影响,而不是可能给开发者带来压力的僵化披露时间表。我们预计像Aardvark这样的工具将导致越来越多的bug被发现,我们希望可持续地合作以实现长期韧性。
为什么这很重要
软件现在是每个行业的支柱------这意味着软件漏洞对商业、基础设施和社会是系统性风险。仅2024年就报告了超过40,000个CVE。我们的测试显示,大约1.2%的提交会引入bug------这些微小的变化可能产生不成比例的后果。
Aardvark代表了一种新的防御者优先模式:一个代理安全研究员,通过随着代码演变提供持续保护来与团队合作。通过早期捕获漏洞、验证现实世界的可利用性并提供清晰的修复方案,Aardvark可以在不减缓创新的情况下加强安全性。我们相信扩大安全专业知识的访问。我们从私人测试版开始,并将在学习过程中扩大可用性。
私人测试版现已开放
我们邀请选定的合作伙伴加入Aardvark私人测试版。参与者将获得早期访问权限,并与我们的团队直接合作,以完善检测准确性、验证工作流程和报告体验。
我们希望在各种环境中验证性能。如果您的组织或开源项目有兴趣加入,您可以在这里申请。
作者 :OpenAI 贡献者:Akshay Bhat, Andy Nguyen, Dave Aitel, Harold Nguyen, Ian Brelinsky, Tiffany Citra, Xin Hu, Matt Knight