一款面向网络安全攻防演练场景的自动化信息收集工具。

工具介绍

潜影是一款为安全研究人员与开发者设计的 Windows GUI 一体化工具,专用于面向网络安全攻防演练场景的自动化信息收集工具。通过智能化的多引擎搜索和敏感信息提取技术,解决了在大规模目标侦察过程中人工搜索效率低下、信息遗漏严重、重复工作繁多的核心痛点,本工具实现了从 自动检索 → 跨引擎去重 → 敏感信息识别 → 信息可视化 → 报告输出 的完整工作流。

效果展示

✨ 解决了哪些实际问题?

1. 规模化目标侦察自动化

  • 问题:对多个目标组织进行全方位信息收集时,需要人工组合各种关键词(如"公司名+招聘"、"品牌+招标"、"域名+联系方式"等),操作繁琐且易遗漏。
  • 解决方案 :潜影 实现主词×副词的笛卡尔积自动生成,一次性生成所有可能的搜索组合,确保搜索维度的完整性。

2. 多源信息聚合困难

  • 问题:不同搜索引擎(百度、Bing、微信)的结果各有侧重,人工切换搜索耗时且难以统一管理结果。
  • 解决方案:工具并行调度多个搜索引擎,统一采集、去重和格式化结果,提供单一视角的完整情报视图。

3. 敏感信息提取效率低下

  • 问题 :从海量网页中手动查找手机号、邮箱等联系方式费时费力,容易因视觉疲劳而遗漏关键信息。
  • 解决方案:内置高精度正则表达式匹配引擎,自动从搜索结果页面中提取11位手机号(1[3-9]开头)和标准邮箱地址,准确率达99%以上。

4. 反爬机制应对复杂

  • 问题:百度等搜索引擎对自动化查询有严格的频率限制,容易触发IP封禁,导致收集工作中断。
  • 解决方案:实现智能交错调度算法和可配置延迟机制。
  • 1)百度首条查询立即执行
  • 2)后续百度查询按用户设定间隔(默认120秒)逐个执行
  • 3)其他引擎查询在百度等待期间穿插进行,最大化时间利用率

5. 结果管理混乱

  • 问题:收集到的信息分散在不同文件、笔记中,难以分析关联和导出报告。
  • 解决方案:提供结构化表格展示和标准化CSV导出(UTF-8 with BOM,兼容Excel中文),支持后续数据分析 4)遇到验证码自动停止相关引擎,避免账户风险

🛠️ 核心特性

🔄 智能组合查询引擎

  • 笛卡尔积搜索生成:自动将主查询词(如"南瑞"、"英大")与副查询词(如"招聘"、"招标"、"领导"、"漏洞")组合,生成所有可能的搜索对
    示例输出:

🌐 多引擎协同采集

  • 百度:中文网络内容覆盖最全,适合国内目标
  • Bing:国际内容+中文混合,提供不同视角
  • 微信/搜狗:获取微信公众号、文章等封闭生态内容
  • Google:预留接口,待政策允许后扩展
  • 并行-串行混合调度:在遵守反爬规则的前提下最大化采集速度

📄 深度翻页采集

  • 可配置采集深度
  • 完整上下文获取:不仅采集标题摘要,还提取页面正文,提高敏感信息发现率

🔍 精准信息提取

  • 手机号识别:严格遵循中国手机号规范(1[3-9]XXXXXXX)
  • 邮箱地址提取:支持常见邮箱格式(@qq.com、@163.com、企业邮箱等)
  • 误判率控制:通过上下文验证减少假阳性
  • 格式化输出:自动去重、排序、分类展示

🎯 反反爬智能策略

  • 动态请求间隔:百度引擎可自定义请求间隔(建议≥120秒)
  • 请求头随机化:模拟真实浏览器行为
  • 失败自动处理:遇到验证码、封禁时智能暂停并提示
  • 会话保持:维持Cookies,提高访问成功率

📊 专业级结果管理

  • 实时表格展示:采集过程中实时更新结果,进度可视
  • 多维度排序:按来源、关键词、时间等多字段排序
  • 批量导出:一键导出为CSV,保留完整字段
  • 包含:关键词、来源、URL、标题、手机号、邮箱、采集时间
  • 数据去重:基于URL和内容哈希自动去重

🖥️ 现代化用户界面

  • 自适应布局:字体和控件随窗口大小自动调整
  • 白色科技风格:简洁专业,减少视觉疲劳
  • 进度可视化:实时显示各引擎进度条和统计信息
  • 日志面板:详细运行日志,便于调试和审计

工具下载

复制代码
https://github.com/xjzhi/TraceHarvest
相关推荐
福大大架构师每日一题1 小时前
lmdeploy v0.12.3:视频输入、Qwen3.5、TurboMind 压缩张量、Ray 安全 API 等重大升级全面解析
安全·lmdeploy
疯狂的维修1 小时前
安全产品的ossd和西门子F_I模块连接检测
自动化
北京耐用通信2 小时前
国产优选:耐达讯自动化EtherCAT转RS232在工业协议转换中的卓越表现
人工智能·科技·物联网·网络协议·自动化
Bruce_Liuxiaowei3 小时前
顺藤摸瓜:一次从防火墙告警到设备实物的溯源实战
运维·网络·网络协议·安全
黎阳之光3 小时前
去标签化无感定位技术突破,黎阳之光重构空间定位技术路径
大数据·人工智能·算法·安全·数字孪生
MarkHD3 小时前
RPA进阶实战:集成邮件自动化与API,构建企业级智能流程机器人
机器人·自动化·rpa
爱码驱动4 小时前
校园IT交流论坛-软件测试报告(功能/接口/自动化)
自动化·测试
蒸汽求职4 小时前
北美求职身份过渡:Day 1 CPT 的合规红线与安全入职指南
开发语言·人工智能·安全·pdf·github·开源协议
calm134 小时前
通信网络单元的划分和级别调整方法分享
网络·安全·web安全