使用Nokogiri库的Python程序

```python

import requests

from bs4 import BeautifulSoup

import os

设置

proxies = {"http": "", "https": ""}

设置headers

headers = {

'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.77 Safari/537.36'

}

设置请求的URL

url = "https://www.yuanfudao.com/"

发送请求

response = requests.get(url, headers=headers,proxies=proxies)

使用BeautifulSoup解析返回的HTML

soup = BeautifulSoup(response.text, 'html.parser')

找到所有img标签

images = soup.find_all('img')

遍历所有img标签

for image in images:

获取图片的src属性

src = image.get('src')

如果图片的src属性以'/'开头,说明是域名外的图片,需要加上'http://www.yuanfudao.com/'前缀

if src.startswith('/'):

src = 'http://www.yuanfudao.com/' + src

获取图片的文件名

filename = src.split('/')[-1]

创建保存图片的文件夹,如果不存在则创建

if not os.path.exists('images'):

os.makedirs('images')

将图片保存到指定的文件夹中

with open('images/' + filename, 'wb') as f:

f.write(requests.get(src, headers=headers,proxies=proxies).content)

```

以上代码的工作原理是,首先发送一个GET请求到指定的URL,并使用BeautifulSoup解析返回的HTML。

然后,它找到所有img标签,并遍历这些标签。对于每个img标签,它获取图片的src属性,并检查这个属性是否以'/'开头。

如果以'/'开头,说明这是域名外的图片。

然后,它获取图片的文件名,并创建一个保存图片的文件夹(如果不存在的话)。

最后,它将图片保存到指定的文件夹中。

相关推荐
m0_716430071 分钟前
Redis如何处理预热失效引起的开局雪崩
jvm·数据库·python
m0_377618234 分钟前
c++文件锁使用方法 c++如何实现多进程文件同步
jvm·数据库·python
gmaajt9 分钟前
mysql多字段搜索如何设计组合索引_mysql索引查询加速
jvm·数据库·python
2301_777599379 分钟前
MySQL如何快速排查慢查询安全隐患_分析slow_query_log进行优化
jvm·数据库·python
m0_7478545211 分钟前
如何检测受保护链接(如 Twitter)的可访问性
jvm·数据库·python
baidu_3409988213 分钟前
宝塔面板如何设置网站访问密码_配置Nginx认证保护目录
jvm·数据库·python
2301_7775993717 分钟前
Python闭包是什么_深入理解Python闭包原理与变量作用域
jvm·数据库·python
HHHHH1010HHHHH17 分钟前
mysql事务回滚与存储引擎的关系_mysql回滚机制分析
jvm·数据库·python
用户83562907805121 分钟前
Python 操作 PowerPoint:添加与设置文本框完整教程
后端·python
InfinteJustice32 分钟前
SQL如何处理分组后的空值统计_善用COALESCE与聚合函数
jvm·数据库·python