使用Nokogiri库的Python程序

```python

import requests

from bs4 import BeautifulSoup

import os

设置

proxies = {"http": "", "https": ""}

设置headers

headers = {

'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.77 Safari/537.36'

}

设置请求的URL

url = "https://www.yuanfudao.com/"

发送请求

response = requests.get(url, headers=headers,proxies=proxies)

使用BeautifulSoup解析返回的HTML

soup = BeautifulSoup(response.text, 'html.parser')

找到所有img标签

images = soup.find_all('img')

遍历所有img标签

for image in images:

获取图片的src属性

src = image.get('src')

如果图片的src属性以'/'开头,说明是域名外的图片,需要加上'http://www.yuanfudao.com/'前缀

if src.startswith('/'):

src = 'http://www.yuanfudao.com/' + src

获取图片的文件名

filename = src.split('/')[-1]

创建保存图片的文件夹,如果不存在则创建

if not os.path.exists('images'):

os.makedirs('images')

将图片保存到指定的文件夹中

with open('images/' + filename, 'wb') as f:

f.write(requests.get(src, headers=headers,proxies=proxies).content)

```

以上代码的工作原理是,首先发送一个GET请求到指定的URL,并使用BeautifulSoup解析返回的HTML。

然后,它找到所有img标签,并遍历这些标签。对于每个img标签,它获取图片的src属性,并检查这个属性是否以'/'开头。

如果以'/'开头,说明这是域名外的图片。

然后,它获取图片的文件名,并创建一个保存图片的文件夹(如果不存在的话)。

最后,它将图片保存到指定的文件夹中。

相关推荐
ydm_ymz2 分钟前
C语言初阶4-数组
c语言·开发语言
presenttttt11 分钟前
用Python和OpenCV从零搭建一个完整的双目视觉系统(六 最终篇)
开发语言·python·opencv·计算机视觉
逐花归海.12 分钟前
『 C++ 入门到放弃 』- 多态
开发语言·c++·笔记·程序人生
卜锦元1 小时前
Go中使用wire进行统一依赖注入管理
开发语言·后端·golang
测试19981 小时前
软件测试之压力测试总结
自动化测试·软件测试·python·测试工具·职场和发展·测试用例·压力测试
军训猫猫头1 小时前
3.检查函数 if (!CheckStart()) return 的妙用 C#例子
开发语言·c#
coding随想1 小时前
JavaScript中的系统对话框:alert、confirm、prompt
开发语言·javascript·prompt
灵哎惹,凌沃敏1 小时前
C语言/Keil的register修饰符
c语言·开发语言
李昊哲小课2 小时前
销售数据可视化分析项目
python·信息可视化·数据分析·matplotlib·数据可视化·seaborn