爬虫案例二

想拿到电影天堂

其中一个下载地址如何实现呢

第一步电影天堂_免费在线观看_迅雷电影下载_电影天堂网 (dytt28.com)电影天堂_电影下载_高清首发 (dytt89.com)电影天堂_免费在线观看_迅雷电影下载_电影天堂网 (dytt28.com)

第一步

我直接打开

requests.exceptions.SSLError: HTTPSConnectionPool(host='www.dytt28.com', port=443): Max retries exceeded with url: / (Caused by SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1000)')))

报错,这个一看就是证书的问题,所以我们需要让SSL证书失效

我们加了verify=False 意思是失效的意思。

然后这时候还出现问题,这个问题是字符集的问题

为什么我使用gbk,因为print自身不支持gb2312,但是他支持gbk,因为gbk是gb2312的扩展,兼容gb2312

至此拿到了页码源代码了

第二步

拿到2024必看热片,所以需要re正则

提取一下数据

用re正则提取了出来。

同时导入了certifi

certifi模块是Python中一个非常有用的工具,用于安全验证。在进行网络请求时,我们常常需要进行SSL证书验证,以确保请求的安全性。而certifi模块提供了一个集合了HTTP访问所需要的根证书的集合,以帮助我们完成SSL证书验证。

第三步

这是我们需要提取其中链接地址

爬到了其中的链接,为了观察方便定义了一个集合,然后把链接放到集合里面

第四步

查看网页代码,可以看到电影名和下载地址,这时候可以用re提取出来

然后拿到了html源码数据,加一个break是中断循环

这样就拿到了下载地址

至于案例结束

相关推荐
阿巴~阿巴~4 小时前
自定义协议设计与实践:从协议必要性到JSON流式处理
服务器·网络·网络协议·json·操作系统·自定义协议
ALex_zry6 小时前
Docker Compose运维技术实战分享:从安装到架构解析
运维·docker·架构
DanCheng-studio7 小时前
网安毕业设计简单的方向答疑
python·毕业设计·毕设
轻抚酸~8 小时前
KNN(K近邻算法)-python实现
python·算法·近邻算法
测试界的海飞丝9 小时前
10道软件测试面试题及其答案:
服务器·测试工具·职场和发展
独行soc9 小时前
2025年渗透测试面试题总结-264(题目+回答)
网络·python·安全·web安全·网络安全·渗透测试·安全狮
t198751289 小时前
在Ubuntu 22.04系统上安装libimobiledevice
linux·运维·ubuntu
skywalk81639 小时前
linux安装Code Server 以便Comate IDE和CodeBuddy等都可以远程连上来
linux·运维·服务器·vscode·comate
汤姆yu10 小时前
基于python的外卖配送及数据分析系统
开发语言·python·外卖分析
@游子10 小时前
内网渗透笔记-Day5
运维·服务器