影刀RPA实战:网页爬虫之桌面壁纸图片

在数字时代的浪潮中,电脑桌面壁纸成了我们日常工作与生活的背景画布,它不仅仅是屏幕保护的简单图案,更是情感与记忆的载体,是个人品味的无声表达。

想象一下,当你打开电脑,首先映入眼帘的是什么?是一片宁静的海滩,还是繁华都市的天际线?是星空璀璨的夜空,还是郁郁葱葱的森林?壁纸的选择,就像是你心情的晴雨表,它随着你的心情和季节的更迭而变化。

春天,你可能会换上一幅樱花盛开的壁纸,让粉色的花瓣在屏幕上绽放,仿佛能闻到春天的气息。夏天,你可能会更喜欢海边的壁纸,让清凉的海风和波光粼粼的海面给你带来一丝凉意。秋天,金黄的落叶或成熟的麦田成了你桌面的常客,它们提醒着你收获的季节。而到了冬天,一片银装素裹的雪景或许能给你带来温暖的感觉。

壁纸也是灵感的源泉。设计师可能会选择一张充满创意的抽象画作为壁纸,激发他们的创造力;作家可能会选择一张历史人物的肖像,激发他们的写作灵感;而学生可能会选择一张包含复杂公式的壁纸,提醒他们学习的重要性。

不仅如此,壁纸还是个人情感的寄托。一张家庭合照,让你在忙碌的工作间隙感受到家的温暖;一张旅行中拍摄的照片,让你回忆起那段美好的时光;一张宠物的可爱照片,让你在疲惫时露出会心的微笑。

在这个快节奏的世界里,我们常常忽视了这些小细节带来的影响。但正是这些看似微不足道的壁纸,构成了我们数字生活的背景,它们默默地陪伴着我们,见证着我们的喜怒哀乐,成为我们生活中不可或缺的一部分。所以,不妨花点时间,选择一张能够触动你心灵的壁纸,让它成为你每天开始工作前的小确幸。

1.实战目标

今天我们就用影刀RPA来实现桌面壁纸爬取,保存到本地的文件夹中。你可以随心所欲的切换壁纸,也可以使用图片编辑器修改,让图片更加赏心悦目。

这个网站无需登录,就可以下载图片,图片类型也很多,所有就选择它给大家操作演示。

本次操作时,顺便爬取了展示小图,如果你想做自己的图片完整,就不用做图片处理了。

演示效果:

2.实战流程

3.实战步骤

3.1 主流程

主流程使用try catch异常处理指令,捕获本流程与调用的子流程中的错误,便于我们集中查看处理。如果我们不在电脑旁边,可以设置异常及时通知机制,通过飞书,邮件等形式发送,或是设置错误重试机制,继续尝试执行。

本次操作时递进式打开网站,没有并列处理的流程,所有主流程就调用了分类列表子流程

3.2 分类列表流程

图片分类,需要鼠标悬浮才能显示,我们悬浮后等待1秒钟,等分类完全显示获取相似列表。这个网站静态化了,展示特别快,所有等待时间设置的少,如果是接口形式返回的,就得计算下平均弹出的时间,设置不好,不能弹出程序就报错了。还有一点事看页面css属性。看是否彻底隐藏了分类元素。

循环时,获取分类的链接地址,传递给分类图片列表子流程。

3.3 图片列表流程

依据传递的分类地址,拼接完成的图片列表地址,打开网址

方法1 获取图片列表

获取图片相似元素列表循环,通过关联元素获取图片名称与地址,将这2项放到一个列表中,传递到下载子流程。

图片相似列表

设置图片信息变量

图片名称

图片地址

同时获取大图网站链接

完整代码:

图片列表中,有的图片时宣传图片,还有下一页图片,这样的我们就不获取了,直接过滤

这个图片的元素与其他图片元素不一样,他的链接地址不是图片,直接过滤

3.4 小图下载流程

主要是设置图片名称,保存时用它做图片名称,还有就是设置保存路径,保存到电脑上的文件夹地址。

为了避免图片名称冲突,可以获取的时间戳,将其拼接到图片名称上,自己实现

下载指令:

3.5 大图下载流程

使用XPath获取大图元素位置,通过他就能获取图名称与下载地址。

为区别图片是大图还是小图,大图保存时,图片名称增加了"大图"两个字眼。

完整代码:

3.6 分页设置

图片列表分页设置

获取总页码元素,提取到总页码。然后for循环,每次点击下一页元素,完成分页设置

总体实战演示:

4.最后

感谢大家,请大家多多支持!

如果你正有一个数据爬取需求,可以留言或私信我,我评估后会制作出教程,分享给大家!

相关推荐
Robot2512 分钟前
Figure 02迎重大升级!!人形机器人独角兽[Figure AI]商业化加速
人工智能·机器人·微信公众平台
LKID体6 分钟前
Python操作neo4j库py2neo使用(一)
python·oracle·neo4j
小尤笔记22 分钟前
利用Python编写简单登录系统
开发语言·python·数据分析·python基础
FreedomLeo127 分钟前
Python数据分析NumPy和pandas(四十、Python 中的建模库statsmodels 和 scikit-learn)
python·机器学习·数据分析·scikit-learn·statsmodels·numpy和pandas
007php0071 小时前
GoZero 上传文件File到阿里云 OSS 报错及优化方案
服务器·开发语言·数据库·python·阿里云·架构·golang
Tech Synapse1 小时前
Python网络爬虫实践案例:爬取猫眼电影Top100
开发语言·爬虫·python
一行玩python2 小时前
SQLAlchemy,ORM的Python标杆!
开发语言·数据库·python·oracle
数据小爬虫@2 小时前
利用Python爬虫获取淘宝店铺详情
开发语言·爬虫·python
编程修仙3 小时前
Collections工具类
linux·windows·python
FreeIPCC3 小时前
谈一下开源生态对 AI人工智能大模型的促进作用
大数据·人工智能·机器人·开源