Python 爬虫网页图片下载到本地

您可以使用Python的requests库来获取网页的源码,使用BeautifulSoup库来解析HTML,并使用urllib库来下载图片到本地。下面是一个示例代码:

复制代码
import requests from bs4 import BeautifulSoup import urllib 
# 获取网页源码 
url = 'https://example.com' 
# 替换成您要获取源码的网页
URL response = requests.get(url) 
html = response.text 
# 解析图片地址
 soup = BeautifulSoup(html, 'html.parser') 
image_tags = soup.find_all('img')
 image_urls = [tag['src'] for tag in image_tags]
 # 下载图片到本地 
for i, image_url in enumerate(image_urls): try: urllib.request.urlretrieve(image_url, f'image_{i+1}.jpg')
 # 图片将保存为'image_1.jpg', 'image_2.jpg'等
 print(f'成功下载图片{i+1}')
 except Exception as e: print(f'下载图片{i+1}时出错:{e}') 

请注意,上述代码中的URL和文件名是示例,您需要根据实际情况进行替换。另外,这段代码只能下载图片类型为JPEG的文件,如果想要下载其他格式的图片,需要进行相应的修改。

相关推荐
Wang's Blog6 分钟前
Nodejs-HardCore: Buffer操作、Base64编码与zlib压缩实战
开发语言·nodejs
csbysj202013 分钟前
C# 集合(Collection)
开发语言
csbysj202027 分钟前
Lua 面向对象编程
开发语言
诸神缄默不语32 分钟前
Python处理Word文档完全指南:从基础到进阶
python
海棠AI实验室1 小时前
第四章 项目目录结构:src/、configs/、data/、tests/ 的黄金布局
python·项目目录结构
左直拳2 小时前
将c++程序部署到docker
开发语言·c++·docker
爱笑的眼睛112 小时前
超越可视化:降维算法组件的深度解析与工程实践
java·人工智能·python·ai
崇山峻岭之间2 小时前
Matlab学习记录31
开发语言·学习·matlab
清铎2 小时前
leetcode_day12_滑动窗口_《绝境求生》
python·算法·leetcode·动态规划