影刀RPA实战:网页爬虫之桌面壁纸图片

在数字时代的浪潮中,电脑桌面壁纸成了我们日常工作与生活的背景画布,它不仅仅是屏幕保护的简单图案,更是情感与记忆的载体,是个人品味的无声表达。

想象一下,当你打开电脑,首先映入眼帘的是什么?是一片宁静的海滩,还是繁华都市的天际线?是星空璀璨的夜空,还是郁郁葱葱的森林?壁纸的选择,就像是你心情的晴雨表,它随着你的心情和季节的更迭而变化。

春天,你可能会换上一幅樱花盛开的壁纸,让粉色的花瓣在屏幕上绽放,仿佛能闻到春天的气息。夏天,你可能会更喜欢海边的壁纸,让清凉的海风和波光粼粼的海面给你带来一丝凉意。秋天,金黄的落叶或成熟的麦田成了你桌面的常客,它们提醒着你收获的季节。而到了冬天,一片银装素裹的雪景或许能给你带来温暖的感觉。

壁纸也是灵感的源泉。设计师可能会选择一张充满创意的抽象画作为壁纸,激发他们的创造力;作家可能会选择一张历史人物的肖像,激发他们的写作灵感;而学生可能会选择一张包含复杂公式的壁纸,提醒他们学习的重要性。

不仅如此,壁纸还是个人情感的寄托。一张家庭合照,让你在忙碌的工作间隙感受到家的温暖;一张旅行中拍摄的照片,让你回忆起那段美好的时光;一张宠物的可爱照片,让你在疲惫时露出会心的微笑。

在这个快节奏的世界里,我们常常忽视了这些小细节带来的影响。但正是这些看似微不足道的壁纸,构成了我们数字生活的背景,它们默默地陪伴着我们,见证着我们的喜怒哀乐,成为我们生活中不可或缺的一部分。所以,不妨花点时间,选择一张能够触动你心灵的壁纸,让它成为你每天开始工作前的小确幸。

1.实战目标

今天我们就用影刀RPA来实现桌面壁纸爬取,保存到本地的文件夹中。你可以随心所欲的切换壁纸,也可以使用图片编辑器修改,让图片更加赏心悦目。

这个网站无需登录,就可以下载图片,图片类型也很多,所有就选择它给大家操作演示。

本次操作时,顺便爬取了展示小图,如果你想做自己的图片完整,就不用做图片处理了。

演示效果:

2.实战流程

3.实战步骤

3.1 主流程

主流程使用try catch异常处理指令,捕获本流程与调用的子流程中的错误,便于我们集中查看处理。如果我们不在电脑旁边,可以设置异常及时通知机制,通过飞书,邮件等形式发送,或是设置错误重试机制,继续尝试执行。

本次操作时递进式打开网站,没有并列处理的流程,所有主流程就调用了分类列表子流程

3.2 分类列表流程

图片分类,需要鼠标悬浮才能显示,我们悬浮后等待1秒钟,等分类完全显示获取相似列表。这个网站静态化了,展示特别快,所有等待时间设置的少,如果是接口形式返回的,就得计算下平均弹出的时间,设置不好,不能弹出程序就报错了。还有一点事看页面css属性。看是否彻底隐藏了分类元素。

循环时,获取分类的链接地址,传递给分类图片列表子流程。

3.3 图片列表流程

依据传递的分类地址,拼接完成的图片列表地址,打开网址

方法1 获取图片列表

获取图片相似元素列表循环,通过关联元素获取图片名称与地址,将这2项放到一个列表中,传递到下载子流程。

图片相似列表

设置图片信息变量

图片名称

图片地址

同时获取大图网站链接

完整代码:

图片列表中,有的图片时宣传图片,还有下一页图片,这样的我们就不获取了,直接过滤

这个图片的元素与其他图片元素不一样,他的链接地址不是图片,直接过滤

3.4 小图下载流程

主要是设置图片名称,保存时用它做图片名称,还有就是设置保存路径,保存到电脑上的文件夹地址。

为了避免图片名称冲突,可以获取的时间戳,将其拼接到图片名称上,自己实现

下载指令:

3.5 大图下载流程

使用XPath获取大图元素位置,通过他就能获取图名称与下载地址。

为区别图片是大图还是小图,大图保存时,图片名称增加了"大图"两个字眼。

完整代码:

3.6 分页设置

图片列表分页设置

获取总页码元素,提取到总页码。然后for循环,每次点击下一页元素,完成分页设置

总体实战演示:

4.最后

感谢大家,请大家多多支持!

如果你正有一个数据爬取需求,可以留言或私信我,我评估后会制作出教程,分享给大家!

相关推荐
带娃的IT创业者6 分钟前
《Python实战进阶》专栏 No.3:Django 项目结构解析与入门DEMO
数据库·python·django
HealthScience35 分钟前
【异常错误】pycharm debug view变量的时候显示不全,中间会以...显示
ide·python·pycharm
猫头虎-人工智能1 小时前
NVIDIA A100 SXM4与NVIDIA A100 PCIe版本区别深度对比:架构、性能与场景解析
gpt·架构·机器人·aigc·文心一言·palm
豌豆花下猫1 小时前
Python 潮流周刊#90:uv 一周岁了,优缺点分析(摘要)
后端·python·ai
Leiditech__2 小时前
人工智能时代电子机器人静电问题及电路设计防范措施
人工智能·嵌入式硬件·机器人·硬件工程
橘猫云计算机设计2 小时前
基于SSM的《计算机网络》题库管理系统(源码+lw+部署文档+讲解),源码可白嫖!
java·数据库·spring boot·后端·python·计算机网络·毕设
小伍_Five2 小时前
从0开始:OpenCV入门教程【图像处理基础】
图像处理·python·opencv
m0_748245342 小时前
python——Django 框架
开发语言·python·django
JAMES费2 小时前
figure机器人技术架构的演进初探——Helix人形机器人控制的革新
架构·机器人
java1234_小锋3 小时前
一周学会Flask3 Python Web开发-客户端状态信息Cookie以及加密
前端·python·flask·flask3