1. 项目概述
Wisdom-Lens 是一个基于大语言模型(LLM)智能体的自动化漏洞挖掘系统,旨在解决传统模糊测试(Fuzzing)过度依赖人工专家、成本高昂、覆盖率低等核心痛点。系统通过构建多智能体协同框架,将 LLM 的代码生成、推理分析与自动化工具链深度融合,实现了从 项目分析 → 目标识别 → Harness 生成 → 模糊测试 → 崩溃分析 → 报告生成 的全流程闭环,效率提升超百倍。
基于智能体的自动化漏洞挖掘系统重构

模糊测试流程图
2. 技术挑战与动机
2.1 传统模糊测试的四大痛点
|----------------|---------------------------------------|
| 痛点 | 描述 |
| 人工依赖度高 | 仅执行阶段自动化,目标选择、Harness 编写、崩溃分析均需专家深度参与 |
| 攻击点偏离 | 聚焦内部 API,与真实攻击场景(文件/网络解析器)脱节 |
| 成本高昂 | 大型代码库 API 海量,种子与 Harness 编写需大量人工与算力 |
| 数据利用率低 | 测试产生的海量崩溃数据缺乏智能分析,价值挖掘不足 |
2.2 LLM 的五大局限
幻觉与不一致性:生成内容可能脱离事实或上下文
缺乏感知与行动能力:无法直接调用工具、操控系统
无持续记忆:单次对话后状态重置,无法积累长期经验
被动响应:缺乏自主规划与反思能力
2.3 智能体(Agent)的破局价值
通过 工具使用 + 外部记忆 + 自主规划 + 反思循环,将 LLM 从"文本生成器"升级为具备行动力的"漏洞挖掘专家":
缓解上下文限制:摘要压缩、分层记忆、工具外包
提升可靠性:验证工具 + 反思循环自动纠错
赋予感知行动:工具调用 = "眼、耳、手"
构建持续记忆:向量数据库存储长期知识与任务状态
实现自主规划:ReAct/AutoGPT 框架驱动"思考-行动-观察"循环
3. 系统架构
Wisdom-Lens 采用分层智能体架构,实现模块化与可扩展性:

4. 核心技术创新
4.1 基于 ANTLR 的多语言静态分析智能体
能力:自动解析 C/C++/Java 源码,生成跨文件的函数调用图(Call Graph)
输出:Graphviz DOT 格式,标准化结构关系
价值:替代人工代码审计,为智能体提供全局架构视图,支撑攻击面识别与影响分析

静态分析工作流图
4.2 基于攻击点分析的定向模糊测试策略
范式转变:从"广撒网"覆盖低级 API → "定点打击"真实攻击面
目标选择原则:聚焦文件解析器、网络协议处理器等高价值入口点
效率跃升:传统数周覆盖率引导 → 分钟级定向测试
可达性验证:智能体克隆仓库验证函数签名,避免误报

4.3 自动化 Harness 生成与"构建直到成功"
Harness 生成三要素:
API 签名严格验证:克隆仓库提取真实函数签名
官方规范初始化:使用库提供的构造函数初始化上下文
标准接入:统一采用 LLVMFuzzerTestOneInput 签名,兼容 LibFuzzer

自动化Harness生成流程图
4.4 LLM 驱动的种子语料生成
问题:随机种子难以触发深层代码路径
方案:Harness 生成后,LLM 自动生成 1-5 个 高质量种子
质量要求:
小巧且触发真实代码路径
覆盖有效/边界场景
含 Magic Number 等关键标识
效果:加速测试路径覆盖,减少无效探索
5 . 后模糊任务:崩溃到报告的自动化闭环
5 .1 崩溃分类(智能过滤)
真实崩溃:存在 crash 文件 且 无 HARNESS_ERROR 标记
假阳性:含 HARNESS_ERROR(Harness 缺陷)
无崩溃:无 crash/oom/timeout 文件
5 .2 崩溃分析(根因定位)
复现命令:生成 crash_reproducer.sh 一键脚本
6 . 应用前景
6 .1 漏洞研究领域
解放研究员:聚焦攻防逻辑,减少重复性劳动
规模化挖掘:自动化扫描全球开源组件,丰富 CVE/NVD 知识库
智能分析:自动完成根因归类、可利用性评估、修复建议生成
6 .2 软件供应链安全
智能物料清单:融合静态分析与依赖图谱,自动构建 SBOM
风险精准测绘:锁定攻击面大、权限高的核心入口(如解析器)
效率革命:将传统数周供应链审计压缩至 数小时
6 .3 未来演进:从发现到修复闭环
目标:调用 LLM(如 OpenAI o3)分析漏洞上下文,自动生成语义正确、风格匹配的安全补丁
补丁内容:包含修复代码、影响范围分析、验证方案、回归测试用例
愿景:实现"自动化挖掘 → 自动化修复 → 自动化验证"的完整安全闭环
7 . 总结
Wisdom-Lens 通过 智能体架构 + 定向模糊测试 + 全自动工具链,将漏洞挖掘从" artisanal craft"(手工艺品)转变为 "industrial pipeline"(工业流水线)。其核心优势在于:
全自动化:零人工干预完成端到端流程
高精准度:聚焦真实攻击面,减少无效测试
强适应性:双模式支持任意开源项目
持续进化:自我优化框架,越测越智能
日志解析:提取 Sanitizer 日志,归因故障代码位置
根因判断:结合上下文识别漏洞类型(堆溢出、UAF等)
在软件供应链安全威胁日益严峻的今天,Wisdom-Lens 为规模化、智能化的漏洞治理提供了可落地的技术范式。