requests入门

一.什么是requests?

之前我们使用from urllib.request import urlopen这个包进行爬虫。

requests也是Python的一个爬虫时可以选择使用的包,而且功能更强大。

二.下载Requests

三.使用Requests写一个爬虫小程序

爬豆瓣的电影页面的html

1.初步代码

python 复制代码
import requests
#要爬的url
url = "https://movie.douban.com/"
#使用requests爬上面的url,并获取响应数据
resp = requests.get(url)
#打印响应数据
print(resp)
print(resp.text)

运行结果:

2.设置请求头的User-Agent(请求者),解决反爬

第一步:获取豆瓣网的任意请求的请求头携带的User-Agent,并复制到粘贴板

第二步:修改爬虫代码

主要是将豆瓣的User-Agent的值,设置到代码的请求头即可。

python 复制代码
import requests
#要爬的url
url = "https://movie.douban.com/"
#解决豆瓣的反爬机制:设置请求头的请求者
myHeaders = {
    #从豆瓣获取即可:检查->网络->点击请求->标头->User-Agent
    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/142.0.0.0 Safari/537.36 Edg/142.0.0.0"
}
#使用requests爬上面的url,并获取响应数据
resp = requests.get(url,headers=myHeaders)
#打印响应数据
print(resp)
print(resp.text)

查看运行效果:

四.一些细节的问题

1.上述爬虫代码,用的为什么是get请求,而不是post?

因为我们要爬的页面,它侧重于获取后端的电影数据,因此判断为get(可能会判断失误,到时候多试试别的请求也是没问题的)

2.requests的结果(resp)中,都包含哪些内容?我们为什么要打印resp.text?

而resp中的text,就代表所爬页面的html代码。

以上就是本篇文章的全部内容,喜欢的话可以留个免费的关注呦~~~

相关推荐
CHANG_THE_WORLD2 分钟前
<Fluent Python > Unicode 文本与字节
开发语言·python
测试员周周4 分钟前
【AI测试系统】第1篇:LangGraph 实战:用 State Graph 搭建 AI测试流水线(4 步编排 + RAG 增强 + 完整代码)
linux·windows·python·功能测试·microsoft·单元测试·多轮对话
噜噜噜阿鲁~8 分钟前
python学习笔记 | 8.2、函数式编程-返回函数
笔记·python·学习
中二痞24 分钟前
下载Python 版本,环境变量变更以及PyCharm更换python版本
开发语言·python·pycharm
SilentSamsara26 分钟前
标准库精讲:collections/itertools/functools/pathlib 实战
开发语言·vscode·python·青少年编程·pycharm
小郑加油27 分钟前
python学习Day8-9天:函数(def)的基础运用
python·学习
2401_8242226927 分钟前
如何卸载并重装Oracle Grid_Deinstall脚本与ASM磁盘清理
jvm·数据库·python
qq_4142565730 分钟前
生产库如何利用Navicat实现配置特定触发器事件调度_提高管理效率
jvm·数据库·python
2301_7756398936 分钟前
mysql如何查看服务器支持的存储引擎_使用SHOW ENGINES命令
jvm·数据库·python
love530love37 分钟前
Python 3.12 解决 MediaPipe “no attribute ‘solutions‘” 终极方案:基于全版本硬核实测的避坑指南
开发语言·人工智能·windows·python·comfyui·mediapipe·solutions