OpenAI推出Aardvark：OpenAI的代理安全研究员

2025年10月30日 | 安全

现已进入私人测试版：一个像安全研究员一样思考的AI代理，能够扩展以满足现代软件的需求。

今天，我们宣布推出Aardvark，一个由GPT-5驱动的代理安全研究员。

软件安全是技术领域最关键------也是最具挑战性------的前沿之一。每年，企业和开源代码库中都会发现数万个新漏洞。防御者面临着在对手之前发现和修补漏洞的艰巨任务。在OpenAI，我们致力于让这种平衡向有利于防御者的方向倾斜。

Aardvark代表了AI和安全研究的突破：一个自主代理，能够帮助开发者和安全团队大规模发现和修复安全漏洞。Aardvark现已进入私人测试版，以在现场验证和完善其能力。

Aardvark的工作原理

Aardvark持续分析源代码存储库，以识别漏洞、评估可利用性、优先处理严重程度并提出针对性的补丁。

Aardvark通过监控代码库的提交和更改来工作，识别漏洞、它们可能被利用的方式并提出修复方案。Aardvark不依赖于像fuzzing或软件组合分析这样的传统程序分析技术。相反，它使用LLM驱动的推理和工具使用来理解代码行为并识别漏洞。Aardvark像人类安全研究员一样寻找bug：通过阅读代码、分析代码、编写和运行测试、使用工具等等。

Aardvark依赖多阶段管道来识别、解释和修复漏洞：

分析：它首先分析整个存储库，生成反映其对项目安全目标和设计理解的威胁模型。
提交扫描：它通过检查提交级别的更改与整个存储库和威胁模型来扫描漏洞，当新代码被提交时。当一个存储库首次连接时，Aardvark将扫描其历史记录以识别现有问题。Aardvark逐步解释它发现的漏洞，为人工审查标注代码。
验证：一旦Aardvark识别出潜在漏洞，它将尝试在隔离的沙盒环境中触发该漏洞以确认其可利用性。Aardvark描述采取的步骤，以帮助确保向用户返回准确、高质量和低误报率的洞察。
修补：Aardvark与OpenAI Codex集成以帮助修复它发现的漏洞。它为每个发现附加Codex生成且经过Aardvark扫描的补丁，供人工审查和高效的一键式修补。

Aardvark与工程师并肩工作，与GitHub、Codex和现有工作流程集成，在不减缓开发的情况下提供清晰、可操作的洞察。虽然Aardvark是为安全而构建的，但在我们的测试中，我们发现它也可以发现诸如逻辑缺陷、不完整修复和隐私问题等bug。

真实的当下影响

Aardvark已经服务了几个月，在OpenAI内部代码库和外部alpha合作伙伴的代码库上持续运行。在OpenAI内部，它发现了有意义的漏洞，并为OpenAI的防御态势做出了贡献。合作伙伴强调了其分析的深度，Aardvark发现了只在复杂条件下出现的问题。

在对"黄金"存储库的基准测试中，Aardvark识别了92%的已知和合成引入的漏洞，展示了高召回率和现实世界的有效性。

Aardvark用于开源

Aardvark也已应用于开源项目，在那里它发现并负责任地披露了众多漏洞------其中十个已获得Common Vulnerabilities and Exposures (CVE)标识符。

作为几十年开放研究和负责任披露的受益者，我们致力于回馈------贡献工具和发现，使数字生态系统对每个人来说都更安全。我们计划向选定的非商业开源存储库提供公益扫描，以贡献于开源软件生态系统和供应链的安全性。

我们最近更新了出站协调披露政策，该政策采取了开发者友好的立场，专注于协作和可扩展的影响，而不是可能给开发者带来压力的僵化披露时间表。我们预计像Aardvark这样的工具将导致越来越多的bug被发现，我们希望可持续地合作以实现长期韧性。

为什么这很重要

软件现在是每个行业的支柱------这意味着软件漏洞对商业、基础设施和社会是系统性风险。仅2024年就报告了超过40,000个CVE。我们的测试显示，大约1.2%的提交会引入bug------这些微小的变化可能产生不成比例的后果。

Aardvark代表了一种新的防御者优先模式：一个代理安全研究员，通过随着代码演变提供持续保护来与团队合作。通过早期捕获漏洞、验证现实世界的可利用性并提供清晰的修复方案，Aardvark可以在不减缓创新的情况下加强安全性。我们相信扩大安全专业知识的访问。我们从私人测试版开始，并将在学习过程中扩大可用性。

私人测试版现已开放

我们邀请选定的合作伙伴加入Aardvark私人测试版。参与者将获得早期访问权限，并与我们的团队直接合作，以完善检测准确性、验证工作流程和报告体验。

我们希望在各种环境中验证性能。如果您的组织或开源项目有兴趣加入，您可以在这里申请。

作者：OpenAI 贡献者：Akshay Bhat, Andy Nguyen, Dave Aitel, Harold Nguyen, Ian Brelinsky, Tiffany Citra, Xin Hu, Matt Knight