爬虫案例二

想拿到电影天堂

其中一个下载地址如何实现呢

第一步电影天堂_免费在线观看_迅雷电影下载_电影天堂网 (dytt28.com)电影天堂_电影下载_高清首发 (dytt89.com)电影天堂_免费在线观看_迅雷电影下载_电影天堂网 (dytt28.com)

第一步

我直接打开

requests.exceptions.SSLError: HTTPSConnectionPool(host='www.dytt28.com', port=443): Max retries exceeded with url: / (Caused by SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1000)')))

报错,这个一看就是证书的问题,所以我们需要让SSL证书失效

我们加了verify=False 意思是失效的意思。

然后这时候还出现问题,这个问题是字符集的问题

为什么我使用gbk,因为print自身不支持gb2312,但是他支持gbk,因为gbk是gb2312的扩展,兼容gb2312

至此拿到了页码源代码了

第二步

拿到2024必看热片,所以需要re正则

提取一下数据

用re正则提取了出来。

同时导入了certifi

certifi模块是Python中一个非常有用的工具,用于安全验证。在进行网络请求时,我们常常需要进行SSL证书验证,以确保请求的安全性。而certifi模块提供了一个集合了HTTP访问所需要的根证书的集合,以帮助我们完成SSL证书验证。

第三步

这是我们需要提取其中链接地址

爬到了其中的链接,为了观察方便定义了一个集合,然后把链接放到集合里面

第四步

查看网页代码,可以看到电影名和下载地址,这时候可以用re提取出来

然后拿到了html源码数据,加一个break是中断循环

这样就拿到了下载地址

至于案例结束

相关推荐
测试员周周1 天前
【Appium 系列】第16节-WebView-H5上下文切换 — 混合应用的自动化难点
运维·开发语言·人工智能·功能测试·appium·自动化·测试用例
测试19981 天前
软件测试 - 单元测试总结
自动化测试·软件测试·python·测试工具·职场和发展·单元测试·测试用例
小辰记事本1 天前
从零读懂RoCEv2数据包构造:从WQE到线缆上的完整旅程
服务器·网络·网络协议·rdma
曲幽1 天前
我用了FastApiAdmin后,连夜把踩过的坑都整理出来了
redis·python·postgresql·vue3·fastapi·web·sqlalchemy·admin·fastapiadmin
在角落发呆1 天前
Linux转发配置:解锁网络互联的核心密码
linux·运维·网络
前端若水1 天前
会话管理:创建、切换、删除对话历史
前端·人工智能·python·react.js
涛声依旧-底层原理研究所1 天前
残差连接与层归一化通俗易懂的详解
人工智能·python·神经网络·transformer
csdn_aspnet1 天前
Python 算法快闪 LeetCode 编号 70 - 爬楼梯
python·算法·leetcode·职场和发展
fantasy_arch1 天前
pytorch人脸匹配模型
人工智能·pytorch·python
熊猫_豆豆1 天前
广义相对论水星近日点进动完整详细数学推导
python·天体·广义相对论