【Python网络爬虫 常见问题汇总】

目录

1. 爬取图片出现403

问题出自案例9,已解决。

【Python网络爬虫笔记】9- 抓取优美图库高清壁纸

当在爬取图库图片时遇到 403 错误(通常表示禁止访问,可能是由于图片防盗链机制)

已获取到图片链接,但是无法打开和下载图片,显示如下:

解决办法:

解决办法:设置请求头中的Referer字段

许多网站的防盗链机制会检查Referer字段,确保请求来自于其自身页面。你可以尝试在请求图片时设置正确的Referer值,例如将其设置为图片所在页面的 URL。在download_images函数中,在请求图片之前添加以下代码:

python 复制代码
headers['Referer'] = link

注意,在下载图片的代码中补充get参数

原代码:

修改后的代码增加了headers

2.关于干坏事的问题

博主是个菜鸡,一点也干不了。

后续不定期更新 欢迎共同探讨学习进步

相关推荐
哈哈不让取名字14 小时前
基于C++的爬虫框架
开发语言·c++·算法
幻云201014 小时前
Python深度学习:从筑基到登仙
前端·javascript·vue.js·人工智能·python
花间相见14 小时前
【JAVA开发】—— Nginx服务器
java·开发语言·nginx
扶苏-su14 小时前
Java---Properties 类
java·开发语言
仰望星空@脚踏实地15 小时前
本地Python脚本是否存在命令注入风险
python·datakit·命令注入
LOnghas121115 小时前
果园环境中道路与树木结构检测的YOLO11-Faster语义分割方法
python
一条咸鱼_SaltyFish16 小时前
远程鉴权中心设计:HTTP 与 gRPC 的技术决策与实践
开发语言·网络·网络协议·程序人生·http·开源软件·个人开发
我即将远走丶或许也能高飞16 小时前
vuex 和 pinia 的学习使用
开发语言·前端·javascript
沐知全栈开发16 小时前
SQL LEN() 函数详解
开发语言
钟离墨笺16 小时前
Go语言--2go基础-->基本数据类型
开发语言·前端·后端·golang