theHarvester - 企业信息收集工具详解

工具概述

theHarvester是一款用于开源情报(OSINT)收集的 Kali Linux 工具,主要用于在渗透测试的初始阶段收集目标企业的电子邮件地址、子域名、IP 地址等信息。

主要特性

🔍 多数据源收集

搜索引擎: Google、Bing、DuckDuckGo 等

专业平台: Shodan、Virustotal、SecurityTrails 等

社交媒体: LinkedIn、Twitter

证书透明: CRT.sh 证书日志

DNS 信息: DNS 查询和反向查询

📊 信息类型

电子邮件地址: 发现企业相关邮箱

子域名: 目标域名的所有子域

虚拟主机: 同一 IP 上的其他网站

IP 地址: 目标系统 IP 信息

员工信息: 从社交媒体获取相关人员

Kali Linux 自带

bash 复制代码
# Kali Linux 预安装
theHarvester -d example.com -b google

命令语法

bash 复制代码
python3 theHarvester.py -d [域名] -b [数据源] -l [结果数量] -f [输出文件]

简单示例

bash 复制代码
# 基本搜索
python3 theHarvester.py -d example.com -b google

# 多数据源搜索
python3 theHarvester.py -d example.com -b google,bing,linkedin

# 限制结果数量
python3 theHarvester.py -d example.com -b google -l 200

# 保存结果到文件
python3 theHarvester.py -d example.com -b all -f results.html

使用所有数据源

bash 复制代码
# 使用所有可用数据源
python3 theHarvester.py -d example.com -b all -f results.xml

指定多个数据源

bash 复制代码
# 选择特定数据源组合
python3 theHarvester.py -d example.com -b google,bing,linkedin,crtsh -l 500

使用代理

bash 复制代码
# 通过代理运行
python3 theHarvester.py -d example.com -b google --proxy 127.0.0.1:8080

深度扫描

bash 复制代码
# 深度搜索模式
python3 theHarvester.py -d example.com -b all -l 1000 --screenshot

API 密钥配置文件位置

bash 复制代码
# API 配置文件
~/.config/theHarvester/api-keys.yaml

配置示例

bash 复制代码
# API 密钥配置文件示例
api_keys:
  shodan: 
    - "YOUR_SHODAN_API_KEY"
  securitytrails:
    - "YOUR_SECURITYTRAILS_API_KEY"
  virustotal:
    - "YOUR_VIRUSTOTAL_API_KEY"
  censys:
    - "YOUR_CENSYS_API_ID"
    - "YOUR_CENSYS_API_SECRET"

输出支持格式
控制台输出 : 直接显示结果
XML 文件 : -f results.xml
JSON 文件 : -f results.json
HTML 报告: -f results.html

使用技巧和最佳实践

🎯 高效扫描策略

分层扫描: 先使用免费源,再使用 API 源

结果验证: 对发现的结果进行手动验证

数据关联: 结合其他工具进行关联分析

⚠️ 注意事项

法律合规: 仅在授权范围内使用

API 限制: 注意各平台的 API 调用限制

速率控制: 避免触发反爬虫机制

与其他工具集成
与 subDomainsBrute 结合

bash 复制代码
# 先用 theHarvester 发现子域名,再用 subDomainsBrute 深度爆破
python3 theHarvester.py -d example.com -b crtsh,dnsdumpster -f subs.txt
python3 subDomainsBrute.py -f subs.txt example.com

与 Nmap 结合

bash 复制代码
# 发现主机后进行端口扫描
python3 theHarvester.py -d example.com -b all | grep -oE '[0-9]+\.[0-9]+\.[0-9]+\.[0-9]+' | sort -u > ips.txt
nmap -iL ips.txt -sS -sV
相关推荐
Flynt3 天前
npm v12 来了:allowScripts 默认关闭,我的项目差点跑不起来
安全·npm·node.js
冬奇Lab8 天前
Skill 系列(02):Skill 安全风险——三类攻击面的实战测试
人工智能·安全·开源
Aphasia31111 天前
VPN 与内网穿透
安全
Mr_愚人派12 天前
当"Claude"不再是 Claude:一次第三方 API 代理引发的 AI 身份伪造排查实录
人工智能·安全
DaLi Yao13 天前
【无标题】
人工智能·安全
Alsn8613 天前
等待学习-学习目录:Docker 容器安全攻防
学习·安全·docker
网络研究院13 天前
2026年网络安全
网络·安全·法律·法规·趋势·发展
treesforest13 天前
AI安全系统如何识别异常访问?IP风险识别正在成为关键能力
网络·人工智能·tcp/ip·安全·web安全
零零信安13 天前
零零信安荣登数世咨询《新质·数字安全专精百强(2026)》暗网情报领域,彰显专业实力与创新引领
安全·网络安全·数据泄露·暗网·零零信安
开发小能手-roy13 天前
StringBuilder vs StringBuffer:2024年还需要线程安全字符串吗?
开发语言·python·安全