Wisdom Lens：基于智能体的自动化漏洞挖掘系统

1. 项目概述

Wisdom-Lens 是一个基于大语言模型（LLM）智能体的自动化漏洞挖掘系统，旨在解决传统模糊测试（Fuzzing）过度依赖人工专家、成本高昂、覆盖率低等核心痛点。系统通过构建多智能体协同框架，将 LLM 的代码生成、推理分析与自动化工具链深度融合，实现了从 项目分析 → 目标识别 → Harness 生成 → 模糊测试 → 崩溃分析 → 报告生成 的全流程闭环，效率提升超百倍。

基于智能体的自动化漏洞挖掘系统重构

模糊测试流程图

2. 技术挑战与动机

2.1 传统模糊测试的四大痛点

|----------------|---------------------------------------|
| 痛点 | 描述 |
| 人工依赖度高 | 仅执行阶段自动化，目标选择、Harness 编写、崩溃分析均需专家深度参与 |
| 攻击点偏离 | 聚焦内部 API，与真实攻击场景（文件/网络解析器）脱节 |
| 成本高昂 | 大型代码库 API 海量，种子与 Harness 编写需大量人工与算力 |
| 数据利用率低 | 测试产生的海量崩溃数据缺乏智能分析，价值挖掘不足 |

2.2 LLM 的五大局限

幻觉与不一致性：生成内容可能脱离事实或上下文

缺乏感知与行动能力：无法直接调用工具、操控系统

无持续记忆：单次对话后状态重置，无法积累长期经验

被动响应：缺乏自主规划与反思能力

2.3 智能体（Agent）的破局价值

通过工具使用 + 外部记忆 + 自主规划 + 反思循环，将 LLM 从"文本生成器"升级为具备行动力的"漏洞挖掘专家"：

缓解上下文限制：摘要压缩、分层记忆、工具外包

提升可靠性：验证工具 + 反思循环自动纠错

赋予感知行动：工具调用 = "眼、耳、手"

构建持续记忆：向量数据库存储长期知识与任务状态

实现自主规划：ReAct/AutoGPT 框架驱动"思考-行动-观察"循环

3. 系统架构

Wisdom-Lens 采用分层智能体架构，实现模块化与可扩展性：

4. 核心技术创新

4.1 基于 ANTLR 的多语言静态分析智能体

能力：自动解析 C/C++/Java 源码，生成跨文件的函数调用图（Call Graph）

输出：Graphviz DOT 格式，标准化结构关系

价值：替代人工代码审计，为智能体提供全局架构视图，支撑攻击面识别与影响分析

静态分析工作流图

4.2 基于攻击点分析的定向模糊测试策略

范式转变：从"广撒网"覆盖低级 API → "定点打击"真实攻击面

目标选择原则：聚焦文件解析器、网络协议处理器等高价值入口点

效率跃升：传统数周覆盖率引导 → 分钟级定向测试

可达性验证：智能体克隆仓库验证函数签名，避免误报

4.3 自动化 Harness 生成与"构建直到成功"

Harness 生成三要素：

API 签名严格验证：克隆仓库提取真实函数签名

官方规范初始化：使用库提供的构造函数初始化上下文

标准接入：统一采用 LLVMFuzzerTestOneInput 签名，兼容 LibFuzzer

自动化Harness生成流程图

4.4 LLM 驱动的种子语料生成

问题：随机种子难以触发深层代码路径

方案：Harness 生成后，LLM 自动生成 1-5 个高质量种子

质量要求：

小巧且触发真实代码路径

覆盖有效/边界场景

含 Magic Number 等关键标识

效果：加速测试路径覆盖，减少无效探索

5 . 后模糊任务：崩溃到报告的自动化闭环

5 .1 崩溃分类（智能过滤）

真实崩溃：存在 crash 文件且无 HARNESS_ERROR 标记

假阳性：含 HARNESS_ERROR（Harness 缺陷）

无崩溃：无 crash/oom/timeout 文件

5 .2 崩溃分析（根因定位）

复现命令：生成 crash_reproducer.sh 一键脚本

6 . 应用前景

6 .1 漏洞研究领域

解放研究员：聚焦攻防逻辑，减少重复性劳动

规模化挖掘：自动化扫描全球开源组件，丰富 CVE/NVD 知识库

智能分析：自动完成根因归类、可利用性评估、修复建议生成

6 .2 软件供应链安全

智能物料清单：融合静态分析与依赖图谱，自动构建 SBOM

风险精准测绘：锁定攻击面大、权限高的核心入口（如解析器）

效率革命：将传统数周供应链审计压缩至数小时

6 .3 未来演进：从发现到修复闭环

目标：调用 LLM（如 OpenAI o3）分析漏洞上下文，自动生成语义正确、风格匹配的安全补丁

补丁内容：包含修复代码、影响范围分析、验证方案、回归测试用例

愿景：实现"自动化挖掘 → 自动化修复 → 自动化验证"的完整安全闭环

7 . 总结

Wisdom-Lens 通过智能体架构 + 定向模糊测试 + 全自动工具链，将漏洞挖掘从" artisanal craft"（手工艺品）转变为 "industrial pipeline"（工业流水线）。其核心优势在于：

全自动化：零人工干预完成端到端流程

高精准度：聚焦真实攻击面，减少无效测试

强适应性：双模式支持任意开源项目

持续进化：自我优化框架，越测越智能

日志解析：提取 Sanitizer 日志，归因故障代码位置

根因判断：结合上下文识别漏洞类型（堆溢出、UAF等）

在软件供应链安全威胁日益严峻的今天，Wisdom-Lens 为规模化、智能化的漏洞治理提供了可落地的技术范式。