Python 爬虫网页图片下载到本地

您可以使用Python的requests库来获取网页的源码,使用BeautifulSoup库来解析HTML,并使用urllib库来下载图片到本地。下面是一个示例代码:

复制代码
import requests from bs4 import BeautifulSoup import urllib 
# 获取网页源码 
url = 'https://example.com' 
# 替换成您要获取源码的网页
URL response = requests.get(url) 
html = response.text 
# 解析图片地址
 soup = BeautifulSoup(html, 'html.parser') 
image_tags = soup.find_all('img')
 image_urls = [tag['src'] for tag in image_tags]
 # 下载图片到本地 
for i, image_url in enumerate(image_urls): try: urllib.request.urlretrieve(image_url, f'image_{i+1}.jpg')
 # 图片将保存为'image_1.jpg', 'image_2.jpg'等
 print(f'成功下载图片{i+1}')
 except Exception as e: print(f'下载图片{i+1}时出错:{e}') 

请注意,上述代码中的URL和文件名是示例,您需要根据实际情况进行替换。另外,这段代码只能下载图片类型为JPEG的文件,如果想要下载其他格式的图片,需要进行相应的修改。

相关推荐
星火开发设计4 分钟前
Java面向对象三大特性:封装、继承与多态的深度解析及实战
java·开发语言·microsoft·多态·继承·面向对象·封装
大学生毕业题目9 分钟前
毕业项目推荐:105-基于yolov8/yolov5/yolo11的烟草等级检测识别系统(Python+卷积神经网络)
人工智能·python·yolo·目标检测·cnn·pyqt·烟草等级
旅途中的宽~22 分钟前
【Python】pip install -v e .命令不想自动更新torch版本
开发语言·python·pip
lly20240623 分钟前
Vue3 指令详解
开发语言
_OP_CHEN37 分钟前
【从零开始的Qt开发指南】(二十三)Qt 界面优化之 QSS 实战指南:从入门到精通,让你的界面颜值飙升!
开发语言·c++·qt·前端开发·界面美化·qss·客户端开发
海棠AI实验室38 分钟前
第 3 篇:方案写作——SOW / 里程碑 / 验收标准 / 风险假设的标准模板
数据库·python
e***985740 分钟前
Java性能优化实战:从原理到案例
java·开发语言·性能优化
HellowAmy42 分钟前
我的C++规范 - 跳跃的对象
开发语言·c++·代码规范
lph00943 分钟前
QtMqtt 的编译与QT环境加载配置
开发语言·qt
高洁011 小时前
AI智能体搭建(4)
python·深度学习·机器学习·transformer·知识图谱