【Python网络爬虫 常见问题汇总】

目录

1. 爬取图片出现403

问题出自案例9,已解决。

【Python网络爬虫笔记】9- 抓取优美图库高清壁纸

当在爬取图库图片时遇到 403 错误(通常表示禁止访问,可能是由于图片防盗链机制)

已获取到图片链接,但是无法打开和下载图片,显示如下:

解决办法:

解决办法:设置请求头中的Referer字段

许多网站的防盗链机制会检查Referer字段,确保请求来自于其自身页面。你可以尝试在请求图片时设置正确的Referer值,例如将其设置为图片所在页面的 URL。在download_images函数中,在请求图片之前添加以下代码:

python 复制代码
headers['Referer'] = link

注意,在下载图片的代码中补充get参数

原代码:

修改后的代码增加了headers

2.关于干坏事的问题

博主是个菜鸡,一点也干不了。

后续不定期更新 欢迎共同探讨学习进步

相关推荐
蓝色的杯子9 分钟前
Python面试30分钟突击掌握
python
qq_208154088530 分钟前
瑞树6代流程分析
javascript·python
上海合宙LuatOS35 分钟前
LuatOS扩展库API——【exremotecam】网络摄像头控制
开发语言·网络·物联网·lua·luatos
好运的阿财39 分钟前
大模型热切换功能完整实现指南
人工智能·python·程序人生·开源·ai编程
feng_you_ying_li41 分钟前
C++11,{}的初始化情况与左右值及其引用
开发语言·数据结构·c++
爱码小白1 小时前
数据库多表命名的通用规范
数据库·python·mysql
xiaotao1311 小时前
JS new 操作符完整执行过程
开发语言·前端·javascript·原型模式
TE-茶叶蛋1 小时前
结合登录页-PHP基础知识点解析
android·开发语言·php
无巧不成书02181 小时前
Java包(package)全解:从定义、使用到避坑,新手零基础入门到实战
java·开发语言·package·java包
大喵桑丶1 小时前
ZABBIX7二次开发AI监控数据调取杂记
大数据·人工智能·python