theHarvester - 企业信息收集工具详解

工具概述

theHarvester是一款用于开源情报(OSINT)收集的 Kali Linux 工具,主要用于在渗透测试的初始阶段收集目标企业的电子邮件地址、子域名、IP 地址等信息。

主要特性

🔍 多数据源收集

搜索引擎: Google、Bing、DuckDuckGo 等

专业平台: Shodan、Virustotal、SecurityTrails 等

社交媒体: LinkedIn、Twitter

证书透明: CRT.sh 证书日志

DNS 信息: DNS 查询和反向查询

📊 信息类型

电子邮件地址: 发现企业相关邮箱

子域名: 目标域名的所有子域

虚拟主机: 同一 IP 上的其他网站

IP 地址: 目标系统 IP 信息

员工信息: 从社交媒体获取相关人员

Kali Linux 自带

bash 复制代码
# Kali Linux 预安装
theHarvester -d example.com -b google

命令语法

bash 复制代码
python3 theHarvester.py -d [域名] -b [数据源] -l [结果数量] -f [输出文件]

简单示例

bash 复制代码
# 基本搜索
python3 theHarvester.py -d example.com -b google

# 多数据源搜索
python3 theHarvester.py -d example.com -b google,bing,linkedin

# 限制结果数量
python3 theHarvester.py -d example.com -b google -l 200

# 保存结果到文件
python3 theHarvester.py -d example.com -b all -f results.html

使用所有数据源

bash 复制代码
# 使用所有可用数据源
python3 theHarvester.py -d example.com -b all -f results.xml

指定多个数据源

bash 复制代码
# 选择特定数据源组合
python3 theHarvester.py -d example.com -b google,bing,linkedin,crtsh -l 500

使用代理

bash 复制代码
# 通过代理运行
python3 theHarvester.py -d example.com -b google --proxy 127.0.0.1:8080

深度扫描

bash 复制代码
# 深度搜索模式
python3 theHarvester.py -d example.com -b all -l 1000 --screenshot

API 密钥配置文件位置

bash 复制代码
# API 配置文件
~/.config/theHarvester/api-keys.yaml

配置示例

bash 复制代码
# API 密钥配置文件示例
api_keys:
  shodan: 
    - "YOUR_SHODAN_API_KEY"
  securitytrails:
    - "YOUR_SECURITYTRAILS_API_KEY"
  virustotal:
    - "YOUR_VIRUSTOTAL_API_KEY"
  censys:
    - "YOUR_CENSYS_API_ID"
    - "YOUR_CENSYS_API_SECRET"

输出支持格式
控制台输出 : 直接显示结果
XML 文件 : -f results.xml
JSON 文件 : -f results.json
HTML 报告: -f results.html

使用技巧和最佳实践

🎯 高效扫描策略

分层扫描: 先使用免费源,再使用 API 源

结果验证: 对发现的结果进行手动验证

数据关联: 结合其他工具进行关联分析

⚠️ 注意事项

法律合规: 仅在授权范围内使用

API 限制: 注意各平台的 API 调用限制

速率控制: 避免触发反爬虫机制

与其他工具集成
与 subDomainsBrute 结合

bash 复制代码
# 先用 theHarvester 发现子域名,再用 subDomainsBrute 深度爆破
python3 theHarvester.py -d example.com -b crtsh,dnsdumpster -f subs.txt
python3 subDomainsBrute.py -f subs.txt example.com

与 Nmap 结合

bash 复制代码
# 发现主机后进行端口扫描
python3 theHarvester.py -d example.com -b all | grep -oE '[0-9]+\.[0-9]+\.[0-9]+\.[0-9]+' | sort -u > ips.txt
nmap -iL ips.txt -sS -sV
相关推荐
星幻元宇VR2 小时前
VR漫游舱:让安全教育不再枯燥
科技·学习·安全·生活·vr
网络安全许木2 小时前
自学渗透测试的第十天(HTTP进阶与Burp Suite基础)
网络·网络协议·http·网络安全·渗透测试
pencek2 小时前
HakcMyVM-VivifyTech
网络安全
见青..2 小时前
DedeCMS织梦5.7--CSRF漏洞复现
前端·网络安全·csrf·漏洞复现
薛定猫AI2 小时前
【深度解析】从 Mythos 安全风波看下一代大模型漏洞挖掘能力与工程实践
人工智能·安全
汤愈韬2 小时前
网络安全之网络基础知识
服务器·网络协议·网络安全·security
小陈工3 小时前
Python Web开发入门(十三):API版本管理与兼容性——让你的接口优雅地“长大”
开发语言·前端·人工智能·python·安全·oracle
金士顿3 小时前
CRA 风险评估:STRIDE 和攻击树
安全
Linux运维技术栈3 小时前
Cloudflare 新版安全仪表板 Bot Fight Mode 403 拦截 调URL接口cf-mitigated: challenge报错解决方案
安全·域名·cloudflare
广州创科水利3 小时前
智慧赋能,守护安澜—广州创科助力五华县37宗水库安全监测
大数据·人工智能·安全