OpenAI推出Aardvark:OpenAI的代理安全研究员

转载

2025年10月30日 | 安全

现已进入私人测试版:一个像安全研究员一样思考的AI代理,能够扩展以满足现代软件的需求。

今天,我们宣布推出Aardvark,一个由GPT-5驱动的代理安全研究员。

软件安全是技术领域最关键------也是最具挑战性------的前沿之一。每年,企业和开源代码库中都会发现数万个新漏洞。防御者面临着在对手之前发现和修补漏洞的艰巨任务。在OpenAI,我们致力于让这种平衡向有利于防御者的方向倾斜。

Aardvark代表了AI和安全研究的突破:一个自主代理,能够帮助开发者和安全团队大规模发现和修复安全漏洞。Aardvark现已进入私人测试版,以在现场验证和完善其能力。

Aardvark的工作原理

Aardvark持续分析源代码存储库,以识别漏洞、评估可利用性、优先处理严重程度并提出针对性的补丁。

Aardvark通过监控代码库的提交和更改来工作,识别漏洞、它们可能被利用的方式并提出修复方案。Aardvark不依赖于像fuzzing或软件组合分析这样的传统程序分析技术。相反,它使用LLM驱动的推理和工具使用来理解代码行为并识别漏洞。Aardvark像人类安全研究员一样寻找bug:通过阅读代码、分析代码、编写和运行测试、使用工具等等。

Aardvark依赖多阶段管道来识别、解释和修复漏洞:

  • 分析:它首先分析整个存储库,生成反映其对项目安全目标和设计理解的威胁模型。

  • 提交扫描:它通过检查提交级别的更改与整个存储库和威胁模型来扫描漏洞,当新代码被提交时。当一个存储库首次连接时,Aardvark将扫描其历史记录以识别现有问题。Aardvark逐步解释它发现的漏洞,为人工审查标注代码。

  • 验证:一旦Aardvark识别出潜在漏洞,它将尝试在隔离的沙盒环境中触发该漏洞以确认其可利用性。Aardvark描述采取的步骤,以帮助确保向用户返回准确、高质量和低误报率的洞察。

  • 修补:Aardvark与OpenAI Codex集成以帮助修复它发现的漏洞。它为每个发现附加Codex生成且经过Aardvark扫描的补丁,供人工审查和高效的一键式修补。

Aardvark与工程师并肩工作,与GitHub、Codex和现有工作流程集成,在不减缓开发的情况下提供清晰、可操作的洞察。虽然Aardvark是为安全而构建的,但在我们的测试中,我们发现它也可以发现诸如逻辑缺陷、不完整修复和隐私问题等bug。

真实的当下影响

Aardvark已经服务了几个月,在OpenAI内部代码库和外部alpha合作伙伴的代码库上持续运行。在OpenAI内部,它发现了有意义的漏洞,并为OpenAI的防御态势做出了贡献。合作伙伴强调了其分析的深度,Aardvark发现了只在复杂条件下出现的问题。

在对"黄金"存储库的基准测试中,Aardvark识别了92%的已知和合成引入的漏洞,展示了高召回率和现实世界的有效性。

Aardvark用于开源

Aardvark也已应用于开源项目,在那里它发现并负责任地披露了众多漏洞------其中十个已获得Common Vulnerabilities and Exposures (CVE)标识符。

作为几十年开放研究和负责任披露的受益者,我们致力于回馈------贡献工具和发现,使数字生态系统对每个人来说都更安全。我们计划向选定的非商业开源存储库提供公益扫描,以贡献于开源软件生态系统和供应链的安全性。

我们最近更新了出站协调披露政策,该政策采取了开发者友好的立场,专注于协作和可扩展的影响,而不是可能给开发者带来压力的僵化披露时间表。我们预计像Aardvark这样的工具将导致越来越多的bug被发现,我们希望可持续地合作以实现长期韧性。

为什么这很重要

软件现在是每个行业的支柱------这意味着软件漏洞对商业、基础设施和社会是系统性风险。仅2024年就报告了超过40,000个CVE。我们的测试显示,大约1.2%的提交会引入bug------这些微小的变化可能产生不成比例的后果。

Aardvark代表了一种新的防御者优先模式:一个代理安全研究员,通过随着代码演变提供持续保护来与团队合作。通过早期捕获漏洞、验证现实世界的可利用性并提供清晰的修复方案,Aardvark可以在不减缓创新的情况下加强安全性。我们相信扩大安全专业知识的访问。我们从私人测试版开始,并将在学习过程中扩大可用性。

私人测试版现已开放

我们邀请选定的合作伙伴加入Aardvark私人测试版。参与者将获得早期访问权限,并与我们的团队直接合作,以完善检测准确性、验证工作流程和报告体验。

我们希望在各种环境中验证性能。如果您的组织或开源项目有兴趣加入,您可以在这里申请。

作者 :OpenAI 贡献者:Akshay Bhat, Andy Nguyen, Dave Aitel, Harold Nguyen, Ian Brelinsky, Tiffany Citra, Xin Hu, Matt Knight

相关推荐
拖拉斯旋风8 小时前
0基础学习Openai之:通过Prompt生成你心中的那幅画🎨
javascript·openai
深色風信子8 小时前
SpringBoot 集成 LangChain4j OpenAI
java·spring boot·spring·openai·langchain4j
机器之心1 天前
刚刚,智源悟界·Emu3.5登场,原生具备世界建模能力
人工智能·openai
后端小肥肠1 天前
又一AI爆款神器!n8n一键生成10w+治愈老奶奶图文到本地磁盘,公号/小红书/抖音都能用!
aigc·openai·agent
沐怡旸1 天前
【提示词】【AI智能体】业务文档问答智能体如何精心设计提示词?
openai
新智元1 天前
1300 亿美元,买断 AGI 未来?OpenAI 完成 5 千亿股改,奥特曼 0 股权
人工智能·openai
新智元1 天前
英伟达,全球首个 5 万亿美元公司诞生!「GPU 帝国」超日本德国 GDP
人工智能·openai
机器之心1 天前
牛津VGG、港大、上交发布ELIP:超越CLIP等,多模态图片检索的增强视觉语言大模型预训练
人工智能·openai
迦蓝叶2 天前
JAiRouter v1.1.0 发布:把“API 调没调通”从 10 分钟压缩到 10 秒
java·人工智能·网关·openai·api·协议归一