Python 爬虫网页图片下载到本地

您可以使用Python的requests库来获取网页的源码,使用BeautifulSoup库来解析HTML,并使用urllib库来下载图片到本地。下面是一个示例代码:

复制代码
import requests from bs4 import BeautifulSoup import urllib 
# 获取网页源码 
url = 'https://example.com' 
# 替换成您要获取源码的网页
URL response = requests.get(url) 
html = response.text 
# 解析图片地址
 soup = BeautifulSoup(html, 'html.parser') 
image_tags = soup.find_all('img')
 image_urls = [tag['src'] for tag in image_tags]
 # 下载图片到本地 
for i, image_url in enumerate(image_urls): try: urllib.request.urlretrieve(image_url, f'image_{i+1}.jpg')
 # 图片将保存为'image_1.jpg', 'image_2.jpg'等
 print(f'成功下载图片{i+1}')
 except Exception as e: print(f'下载图片{i+1}时出错:{e}') 

请注意,上述代码中的URL和文件名是示例,您需要根据实际情况进行替换。另外,这段代码只能下载图片类型为JPEG的文件,如果想要下载其他格式的图片,需要进行相应的修改。

相关推荐
未若君雅裁2 分钟前
死锁产生条件与诊断:jps、jstack、VisualVM
java·开发语言
再玩一会儿看代码2 分钟前
Java抽象类和接口区别_场景理解
java·开发语言·经验分享·笔记·python
大蚂蚁2号4 分钟前
Python迭代器与生成器深度剖析:从底层协议到工程实战
python
专注搞钱5 分钟前
AI编程实战:我用Python+LangChain搭建了一个半导体FAB智能运维Agent
python·langchain·ai编程
于先生吖10 分钟前
Java消息队列优化抢单逻辑,同城搬家拉货多场景业务数据库架构设计
java·开发语言·数据库架构
半个烧饼不加肉10 分钟前
JS 底层探究--执行上下文
开发语言·前端·javascript
财经资讯数据_灵砚智能11 分钟前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年6月3日
大数据·人工智能·python·信息可视化·自然语言处理·灵砚智能
开源量化GO12 分钟前
期货量化价差合约怎么订:天勤 SP 组合代码与订阅注意点
python·区块链
财经资讯数据_灵砚智能13 分钟前
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年5月30日
人工智能·python·信息可视化·自然语言处理·ai编程·灵砚智能
AI玫瑰助手16 分钟前
Python函数:global与nonlocal关键字的使用
开发语言·python·信息可视化