Wisdom Lens:基于智能体的自动化漏洞挖掘系统

1. 项目概述

Wisdom-Lens 是一个基于大语言模型(LLM)智能体的自动化漏洞挖掘系统,旨在解决传统模糊测试(Fuzzing)过度依赖人工专家、成本高昂、覆盖率低等核心痛点。系统通过构建多智能体协同框架,将 LLM 的代码生成、推理分析与自动化工具链深度融合,实现了从 项目分析 → 目标识别 → Harness 生成 → 模糊测试 → 崩溃分析 → 报告生成 的全流程闭环,效率提升超百倍。

基于智能体的自动化漏洞挖掘系统重构

模糊测试流程图

2. 技术挑战与动机

2.1 传统模糊测试的四大痛点

|----------------|---------------------------------------|
| 痛点 | 描述 |
| 人工依赖度高 | 仅执行阶段自动化,目标选择、Harness 编写、崩溃分析均需专家深度参与 |
| 攻击点偏离 | 聚焦内部 API,与真实攻击场景(文件/网络解析器)脱节 |
| 成本高昂 | 大型代码库 API 海量,种子与 Harness 编写需大量人工与算力 |
| 数据利用率低 | 测试产生的海量崩溃数据缺乏智能分析,价值挖掘不足 |

2.2 LLM 的五大局限

幻觉与不一致性:生成内容可能脱离事实或上下文

缺乏感知与行动能力:无法直接调用工具、操控系统

无持续记忆:单次对话后状态重置,无法积累长期经验

被动响应:缺乏自主规划与反思能力

2.3 智能体(Agent)的破局价值

通过 工具使用 + 外部记忆 + 自主规划 + 反思循环,将 LLM 从"文本生成器"升级为具备行动力的"漏洞挖掘专家":

缓解上下文限制:摘要压缩、分层记忆、工具外包

提升可靠性:验证工具 + 反思循环自动纠错

赋予感知行动:工具调用 = "眼、耳、手"

构建持续记忆:向量数据库存储长期知识与任务状态

实现自主规划:ReAct/AutoGPT 框架驱动"思考-行动-观察"循环

3. 系统架构

Wisdom-Lens 采用分层智能体架构,实现模块化与可扩展性:

4. 核心技术创新

4.1 基于 ANTLR 的多语言静态分析智能体

能力:自动解析 C/C++/Java 源码,生成跨文件的函数调用图(Call Graph)

输出:Graphviz DOT 格式,标准化结构关系

价值:替代人工代码审计,为智能体提供全局架构视图,支撑攻击面识别与影响分析

静态分析工作流图

4.2 基于攻击点分析的定向模糊测试策略

范式转变:从"广撒网"覆盖低级 API → "定点打击"真实攻击面

目标选择原则:聚焦文件解析器、网络协议处理器等高价值入口点

效率跃升:传统数周覆盖率引导 → 分钟级定向测试

可达性验证:智能体克隆仓库验证函数签名,避免误报

4.3 自动化 Harness 生成与"构建直到成功"

Harness 生成三要素:

API 签名严格验证:克隆仓库提取真实函数签名

官方规范初始化:使用库提供的构造函数初始化上下文

标准接入:统一采用 LLVMFuzzerTestOneInput 签名,兼容 LibFuzzer

自动化Harness生成流程图

4.4 LLM 驱动的种子语料生成

问题:随机种子难以触发深层代码路径

方案:Harness 生成后,LLM 自动生成 1-5 个 高质量种子

质量要求:

小巧且触发真实代码路径

覆盖有效/边界场景

含 Magic Number 等关键标识

效果:加速测试路径覆盖,减少无效探索

5 . 后模糊任务:崩溃到报告的自动化闭环

5 .1 崩溃分类(智能过滤)

真实崩溃:存在 crash 文件 且 无 HARNESS_ERROR 标记

假阳性:含 HARNESS_ERROR(Harness 缺陷)

无崩溃:无 crash/oom/timeout 文件

5 .2 崩溃分析(根因定位)

复现命令:生成 crash_reproducer.sh 一键脚本

6 . 应用前景

6 .1 漏洞研究领域

解放研究员:聚焦攻防逻辑,减少重复性劳动

规模化挖掘:自动化扫描全球开源组件,丰富 CVE/NVD 知识库

智能分析:自动完成根因归类、可利用性评估、修复建议生成

6 .2 软件供应链安全

智能物料清单:融合静态分析与依赖图谱,自动构建 SBOM

风险精准测绘:锁定攻击面大、权限高的核心入口(如解析器)

效率革命:将传统数周供应链审计压缩至 数小时

6 .3 未来演进:从发现到修复闭环

目标:调用 LLM(如 OpenAI o3)分析漏洞上下文,自动生成语义正确、风格匹配的安全补丁

补丁内容:包含修复代码、影响范围分析、验证方案、回归测试用例

愿景:实现"自动化挖掘 → 自动化修复 → 自动化验证"的完整安全闭环

7 . 总结

Wisdom-Lens 通过 智能体架构 + 定向模糊测试 + 全自动工具链,将漏洞挖掘从" artisanal craft"(手工艺品)转变为 "industrial pipeline"(工业流水线)。其核心优势在于:

全自动化:零人工干预完成端到端流程

高精准度:聚焦真实攻击面,减少无效测试

强适应性:双模式支持任意开源项目

持续进化:自我优化框架,越测越智能

日志解析:提取 Sanitizer 日志,归因故障代码位置

根因判断:结合上下文识别漏洞类型(堆溢出、UAF等)

在软件供应链安全威胁日益严峻的今天,Wisdom-Lens 为规模化、智能化的漏洞治理提供了可落地的技术范式。

相关推荐
深信达沙箱2 小时前
常见数据泄露途径测试用例
服务器·安全·测试用例·源代码
卓豪终端管理2 小时前
每周5小时“隐形流失”,如何精准锁定并回收?
网络·安全·web安全
美林数据Tempodata2 小时前
智能体技术应用专业建设方案与实施路径
人工智能·ai·智能体·智能体技术应用·智能体技术应用专业
星哥说事3 小时前
SELinux 与 AppArmor 的配置,增强系统安全性
安全
white-persist3 小时前
【攻防世界】reverse | tt3441810 详细题解 WP
java·c语言·开发语言·数据结构·c++·算法·安全
QZ166560951593 小时前
高兼容性、联动闭环、规模化:医疗行业数据分类分级管理系统解决
安全
xixixi777773 小时前
猫池:黑产的“手机农场”与攻防最前线
安全·通信·反诈·运营商·监管·猫池·黑产
三七吃山漆3 小时前
攻防世界——Web_php_wrong_nginx_config
开发语言·nginx·安全·web安全·网络安全·php·ctf
火羽白麟3 小时前
大坝安全的“血液”——数据支撑
安全·大坝·水利