【酱浦菌-爬虫项目】python爬取彼岸桌面壁纸

  1. 首先,代码导入了两个库:requestsparsel。这些库用于处理HTTP请求和解析HTML内容。

  2. 然后,它定义了一个变量url,指向网站'樱花2024年4月日历风景桌面壁纸_高清2024年4月日历壁纸_彼岸桌面'。

  3. 接下来,设置了一个HTTP请求的头部信息,模拟了一个Chrome浏览器的请求。

  4. 通过requests.get()方法,发送一个GET请求到指定的URL,并将响应内容保存在response变量中。

  5. 使用response.apparent_encoding来设置响应的编码方式。

  6. 创建一个parsel.Selector对象,用于解析HTML内容。

  7. 从HTML中选择所有<li>元素,这些元素包含了图片的信息。

  8. 遍历每个

    复制代码
     <li>

    元素:

    • 提取<b>标签内的文本作为图片的标题。

    • 如果存在标题,提取<img>标签的src属性,即图片的URL。

    • 使用requests.get()方法获取图片的内容。

    • 将图片内容写入到以标题命名的文件中(保存在img文件夹下)。

    • 打印图片的URL和标题。

  9. 最后,输出一条消息表示下载完成。

完整代码如下:

python 复制代码
#http://www.netbian.com/desk/33413.htm
import requests
import parsel
url = 'http://www.netbian.com/desk/33413.htm'
headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/123.0.0.0 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
response.encoding = response.apparent_encoding
selector = parsel.Selector(response.text)
lis = selector.css('.list li')
print('====================')
print('开始下载:')
for li in lis:
        title = li.css('b::text').get()
        if title:
            li_url = li.css('img::attr(src)').get()
            img_content = requests.get(url = li_url).content
            with open('img\\' + title + '.jpg', mode = 'wb') as f:
                f.write(img_content)
            print(li_url, title)
print('下载完成!')
print('====================')

运行效果如下:

相关推荐
devmoon4 分钟前
在 Polkadot 上部署独立区块链Paseo 测试网实战部署指南
开发语言·安全·区块链·polkadot·erc-20·测试网·独立链
lili-felicity4 分钟前
CANN流水线并行推理与资源调度优化
开发语言·人工智能
沐知全栈开发5 分钟前
CSS3 边框:全面解析与实战技巧
开发语言
lili-felicity7 分钟前
CANN模型量化详解:从FP32到INT8的精度与性能平衡
人工智能·python
数据知道10 分钟前
PostgreSQL实战:详解如何用Python优雅地从PG中存取处理JSON
python·postgresql·json
island131414 分钟前
CANN GE(图引擎)深度解析:计算图优化管线、内存静态规划与异构 Stream 调度机制
c语言·开发语言·神经网络
曹牧19 分钟前
Spring Boot:如何在Java Controller中处理POST请求?
java·开发语言
浅念-22 分钟前
C++入门(2)
开发语言·c++·经验分享·笔记·学习
WeiXiao_Hyy22 分钟前
成为 Top 1% 的工程师
java·开发语言·javascript·经验分享·后端
ZH154558913123 分钟前
Flutter for OpenHarmony Python学习助手实战:面向对象编程实战的实现
python·学习·flutter