【Python网络爬虫 常见问题汇总】

目录

1. 爬取图片出现403

问题出自案例9,已解决。

【Python网络爬虫笔记】9- 抓取优美图库高清壁纸

当在爬取图库图片时遇到 403 错误(通常表示禁止访问,可能是由于图片防盗链机制)

已获取到图片链接,但是无法打开和下载图片,显示如下:

解决办法:

解决办法:设置请求头中的Referer字段

许多网站的防盗链机制会检查Referer字段,确保请求来自于其自身页面。你可以尝试在请求图片时设置正确的Referer值,例如将其设置为图片所在页面的 URL。在download_images函数中,在请求图片之前添加以下代码:

python 复制代码
headers['Referer'] = link

注意,在下载图片的代码中补充get参数

原代码:

修改后的代码增加了headers

2.关于干坏事的问题

博主是个菜鸡,一点也干不了。

后续不定期更新 欢迎共同探讨学习进步

相关推荐
AC赳赳老秦7 小时前
OpenClaw实战案例:用Agent实现每日工作日报自动生成+发送
人工智能·python·职场和发展·eclipse·github·deepseek·openclaw
qq_189807037 小时前
html标签如何提升可访问性_aria-label与title区别【指南】
jvm·数据库·python
无忧.芙桃7 小时前
现代C++精讲之处理类型
开发语言·c++
黎梨梨梨_7 小时前
C++入门基础(下)(重载,引用,inline,nullptr)
开发语言·c++·算法
谁刺我心7 小时前
[QML]Functional功能型控件-虚拟键盘
开发语言·qml·虚拟键盘
qq_349317487 小时前
mysql如何设置定时自动备份脚本_编写shell脚本与cron任务
jvm·数据库·python
feVA LTYR7 小时前
Windows上安装Go并配置环境变量(图文步骤)
开发语言·windows·golang
2401_832365527 小时前
Chart.js 4 中基于数据实际范围的线性渐变填充方案
jvm·数据库·python
好运的阿财7 小时前
OpenClaw工具拆解之tts+web_search
前端·javascript·python·ai·ai编程·openclaw·openclaw工具
qq_342295827 小时前
如何让 Bootstrap 图标在 Vue 3 中持续旋转动画
jvm·数据库·python