【Python网络爬虫 常见问题汇总】

目录

1. 爬取图片出现403

问题出自案例9,已解决。

【Python网络爬虫笔记】9- 抓取优美图库高清壁纸

当在爬取图库图片时遇到 403 错误(通常表示禁止访问,可能是由于图片防盗链机制)

已获取到图片链接,但是无法打开和下载图片,显示如下:

解决办法:

解决办法:设置请求头中的Referer字段

许多网站的防盗链机制会检查Referer字段,确保请求来自于其自身页面。你可以尝试在请求图片时设置正确的Referer值,例如将其设置为图片所在页面的 URL。在download_images函数中,在请求图片之前添加以下代码:

python 复制代码
headers['Referer'] = link

注意,在下载图片的代码中补充get参数

原代码:

修改后的代码增加了headers

2.关于干坏事的问题

博主是个菜鸡,一点也干不了。

后续不定期更新 欢迎共同探讨学习进步

相关推荐
浔川python社几秒前
浔川AI翻译v6.1.0版本正式发布 全面升级安全体验与交互效率
python
156082072191 分钟前
在QT下添加QWT6.1.4功能
开发语言·qt
开开心心_Every1 分钟前
图片批量压缩工具:支持有损无损两种模式
python·游戏·微信·django·pdf·excel·语音识别
GIS之路5 分钟前
ArcGIS Pro 实现影像波段合成
前端·python·信息可视化
edisao5 分钟前
二。星链真正危险的地方,不在天上,而在网络底层
大数据·网络·人工智能·python·科技·机器学习
minglie17 分钟前
micropython_spiFlash_w25qxx
开发语言·python
Loo国昌9 分钟前
【LangChain1.0】第一篇:基础认知
后端·python·算法·语言模型·prompt
源代码•宸10 分钟前
Golang原理剖析(channel面试与分析)
开发语言·经验分享·后端·面试·golang·select·channel
一代土怪16 分钟前
django中设置中国时区
python·django
H Corey19 分钟前
Java--面向对象之继承与多态
java·开发语言·windows·学习·算法·intellij-idea