Python爬虫之路(3)-- 抓包工具介绍

转载来源:CrawlerTutorial/爬虫入门/05_常用的抓包工具有那些.md at main · NanmiCoder/CrawlerTutorial (github.com)

利用各种工具抓包网络请求

在进行网络爬虫开发时,抓包是一个非常重要的步骤。它可以帮助我们了解客户端和服务器之间的通信过程,包括请求的发送和响应的接收。这对于分析和模拟网络请求尤其关键。本教程将介绍几种常用的抓包工具,包括Chrome的开发者工具、Charles和Fiddler。

  • Chrome抓包Web应用
  • Charles和Fiddler既可以抓包APP也可以抓包Web

使用Chrome的开发者工具

我之前写了一篇博客微博爬虫的示例,其中有关于Chrome F12抓包的文章,感兴趣的可以去看下:微博帖子评论爬取教程

Chrome浏览器内置的开发者工具是最直接便捷的抓包方式之一,特别适合前后端分离的网站分析。

  1. 打开Chrome浏览器,访问目标网站。

  2. F12或右键点击页面,选择"检查"打开开发者工具。

  3. 切换到"Network"(网络)标签页。此时可能需要刷新页面以捕获所有网络请求。

  4. 浏览网络请求列表,点击任一请求查看详细信息,包括请求头、响应头、响应体等。

  5. 可以通过过滤器筛选特定类型的请求,例如XHR(Ajax请求)。

  6. 使用Chrome开发者工具的优点在于无需安装额外软件,操作简单,适合快速查看和分析HTTP/HTTPS请求。

然后刷新页面,重新加载网站,让服务端重新发送数据给我们。

使用Charles

当我有抓取APP或者小程序等需求的时候,我用charles比较多一些,因为它对Macos支持比较友好。

具体安装和使用示例可以看这篇文章,写的比较细:charles安装入门使用示例

Charles是一款广受欢迎的跨平台抓包工具,它可以作为代理服务器运行,监控和修改进出电脑的所有HTTP和HTTPS请求。

  1. 下载并安装Charles。
  2. 启动Charles,它会自动开始捕获网络请求。
  3. 配置浏览器或设备使用Charles为代理服务器。这通常涉及到设置代理服务器地址为127.0.0.1(本机地址),端口为Charles显示的端口(默认8888)。
  4. 访问目标网站或应用,Charles会显示通过它的所有请求和响应。
  5. 双击任一请求或响应以查看详细内容。

Charles强大之处在于它能够修改请求或响应,实现更深入的测试和分析。

使用Fiddler

这款工具在windows平台很火,我之前在上一家公式做一些爬虫的小需求有用过,整体尚可,但是好像已经开始收费了,免费版的功能又受限。

具体安装和使用示例可以看这篇文章,写的比较细:Fiddler安装入门使用示例

Fiddler同样是一款功能强大的网络请求分析工具,它也可以捕获计算机上的HTTP/HTTPS请求。

  1. 下载并安装Fiddler。
  2. 启动Fiddler,它默认开始捕获网络请求。
  3. 在"Web Sessions"窗口中,可以看到通过Fiddler的所有HTTP/HTTPS请求和响应。
  4. 点击任一条目查看详细的请求和响应信息。

Fiddler提供了广泛的自定义选项,包括断点设置、请求编辑、性能测试等高级功能。

总结

抓包是网络爬虫开发中不可或缺的一环。通过使用Chrome开发者工具、Charles、Fiddler等工具,我们可以有效地分析和理解客户端与服务器之间的通信过程。这些工具各有特点,选择合适的工具可以大大提高爬虫开发的效率和质量。

相关推荐
波诺波19 分钟前
通用装饰器示例
开发语言·python
程序员爱钓鱼1 小时前
Python编程实战 · 基础入门篇 | 变量与命名规范
后端·python
007php0071 小时前
猿辅导Java面试真实经历与深度总结(二)
java·开发语言·python·计算机网络·面试·职场和发展·golang
惊鸿.Jh1 小时前
C++可变参数模板
开发语言·python
MoRanzhi12031 小时前
Pillow 基础图像操作与数据预处理
图像处理·python·深度学习·机器学习·numpy·pillow·数据预处理
素素.陈1 小时前
向RAGFlow中上传文档到对应的知识库
开发语言·python
小宁爱Python1 小时前
Django Web 开发系列(一):视图基础与 URL 路由配置全解析
后端·python·django
空影星1 小时前
SiriKali,一款跨平台的加密文件管理器
python·编辑器·电脑·智能硬件
阿_旭1 小时前
基于深度学习的甲状腺结节智能检测分割与诊断系统【python源码+Pyqt5界面+数据集+训练代码】
人工智能·python·深度学习·甲状腺结节检测
woshihonghonga1 小时前
PyTorch矩阵乘法函数区别解析与矩阵高级索引说明——《动手学深度学习》3.6.3、3.6.4和3.6.5 (P79)
人工智能·pytorch·python·深度学习·jupyter·矩阵