使用Nokogiri库的Python程序

```python

import requests

from bs4 import BeautifulSoup

import os

设置

proxies = {"http": "", "https": ""}

设置headers

headers = {

'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.77 Safari/537.36'

}

设置请求的URL

url = "https://www.yuanfudao.com/"

发送请求

response = requests.get(url, headers=headers,proxies=proxies)

使用BeautifulSoup解析返回的HTML

soup = BeautifulSoup(response.text, 'html.parser')

找到所有img标签

images = soup.find_all('img')

遍历所有img标签

for image in images:

获取图片的src属性

src = image.get('src')

如果图片的src属性以'/'开头,说明是域名外的图片,需要加上'http://www.yuanfudao.com/'前缀

if src.startswith('/'):

src = 'http://www.yuanfudao.com/' + src

获取图片的文件名

filename = src.split('/')[-1]

创建保存图片的文件夹,如果不存在则创建

if not os.path.exists('images'):

os.makedirs('images')

将图片保存到指定的文件夹中

with open('images/' + filename, 'wb') as f:

f.write(requests.get(src, headers=headers,proxies=proxies).content)

```

以上代码的工作原理是,首先发送一个GET请求到指定的URL,并使用BeautifulSoup解析返回的HTML。

然后,它找到所有img标签,并遍历这些标签。对于每个img标签,它获取图片的src属性,并检查这个属性是否以'/'开头。

如果以'/'开头,说明这是域名外的图片。

然后,它获取图片的文件名,并创建一个保存图片的文件夹(如果不存在的话)。

最后,它将图片保存到指定的文件夹中。

相关推荐
旧时光巷1 小时前
【机器学习③】 | CNN篇
人工智能·pytorch·python·机器学习·cnn·卷积神经网络·lenet-5
李永奉1 小时前
C语言-指针初级(指针定义、指针的作用、指针的计算、野指针、悬空指针、void类型指针)
c语言·开发语言
Full Stack Developme1 小时前
Java 日期时间处理:分类、用途与性能分析
java·开发语言·数据库
amazinging1 小时前
北京-4年功能测试2年空窗-报培训班学测开-第六十六天
python·学习·面试
2301_793086875 小时前
JVM 01 运行区域
java·开发语言
愤怒的小鸟~~~5 小时前
c语言创建的一个队列结构(含有这个头指针和这个尾指针的结构具有一定的参考价值)
c语言·开发语言·算法
叫我:松哥6 小时前
python案例:基于python 神经网络cnn和LDA主题分析的旅游景点满意度分析
人工智能·python·神经网络·数据挖掘·数据分析·cnn·课程设计
2202_756749697 小时前
01 基于sklearn的机械学习-机械学习的分类、sklearn的安装、sklearn数据集及数据集的划分、特征工程(特征提取与无量纲化、特征降维)
人工智能·python·机器学习·分类·sklearn
鹿野素材屋7 小时前
C#中对于List的多种排序方式
开发语言·c#
whxnchy8 小时前
C++刷题 - 7.27
开发语言·c++