用影刀RPA获取公呺搜索关键词文章数据,如何判断文章条目元素是否在可视区域?| 文章列表的循环点击方案拆解

用影刀RPA做公呺自动化时,一个非常典型的需求场景是:按一组关键词,在某信搜一搜中自动化获取公呺文章的公开数据。

整体流程看起来很清楚:搜索关键词、切换筛选条件、进入文章、提取字段,再写入 Excel 表格。

这些步骤本身都不复杂,但真正尝试过搭建这套RPA流程的新手,**几乎都会卡在同一个地方------搜索结果页的文章列表。**文章条目明明都能获取到,但循环点击处理几篇文章后,就开始出现点空、点偏,导致整个应用无法正常执行下去。

下面我会围绕这个场景,讲一下自己搭建的这个"公呺关键词搜索文章公开数据获取 RPA机器人",并重点分享"实现稳定循环点击每篇文章"的解决思路

一、应用介绍

这是一款基于影刀RPA开发的"公呺关键词搜索文章公开数据获取RPA应用(桌面自动化)"。

用户简单配置启动参数,程序就会自动激活某信窗口,在某信搜一搜中搜索关键词、匹配筛选条件,并逐篇打开公呺文章,抓取核心公开信息字段并写入表格。

目前支持的具体功能点:

  • 支持从 EXCEL 循环导入多行关键词:按配置顺序逐条读取关键词,在某信搜一搜中自动执行获取流程。
  • **支持完整获取公呺文章公开字段:**当前可获取字段包括:文章标题、文章链接、发布时间、阅读量、点赞数、分享数、在看数、留言数等
  • **支持5 种搜索结果筛选模式:**可按需求切换:不限、最新、最热、已关注、最近读过。
  • 支持自定义获取文章数量:可自定义设置获取文章篇数。
  • 支持按"最新"条件限定时间范围获取 :在选择"最新"筛选模式下,可指定仅获取 某自定义截止日期内的文章公开数据,如"近 7 天、近 30 天"发布的文章。
  • 内置文章列表可视区域判断与动态滚动机制 :自动判断文章元素是否完整处于安全点击区:在可视区域内 → 直接点击,超出可视区域 → 自动滚动页面并重新定位后点击

二、运行演示

这里以"品牌营销"这个搜索词为例,获取10篇文章,具体运行效果如下:

(*审核失败)

三、流程搭建

1、流程指令长图

2、核心难点("循环点击")

某信搜索结果页的文章列表应用了懒加载技术,能不能顺利点击,取决于它是否完整地落在"安全点击区(可视区域)"内,而不是你有没有拿到这个元素。

我们用一个最直观的场景来理解。

假设你的电脑屏幕高度为:900px,其中:电脑任务栏高度为40px,某信窗口高度为860px。(*其中"浏览器&页面容器层"高度为40px、"搜一搜顶部功能区&搜索结果类型导航区"高度为110px、"搜索结果筛选排序区&文章列表区"高度为710px)

而某信窗口的文章条目可见区域里(高度在"150-860px")只能同时显示有限数量的文章,比如 5 篇文章。

那么,前5篇文章因为在屏幕可视区域内,就能顺利点击。而后面的文章条目,虽然你前面也能通过"获取相似元素列表(Win)"指令获取到,但程序执行循环点击时是基于"坐标位置"在点的。

后面的文章条目并未出现在可视区域内,即"程序点的位置,已经不在屏幕里了",这就会导致出现:实际点击到下方电脑任务栏的情况,流程卡死执行不下去。

那么我们对应的处理思路也很明晰了,就是:判断当前循环到的文章条目是否完整的落在可视区域内。

这个判断放到影刀RPA中,就是"坐标位置"必须同时满足:文章条目元素.Top > 可见区域元素.Top ,并且文章条目元素.Bottom < 可见区域元素.Bottom

若满足,则点击文章执行获取,直至当前可视区域内的文章处理完。若不满足,则滚动页面,让新的文章进入安全区,重复以上流程,再获取一次文章条目的坐标,再判断--再点击--再滚动......

*总结:文章条目列表可以很长,但点击只能发生在可视区域内。超过显示范围的文章,必须先滚进屏幕,再进行点击。所以正确做法不是"一直往下点",而是"点一屏,滚一屏"。

四、如何获取 & 应用?

1、启动参数说明

启动应用后,用户需要依次输入或选择以下参数:

  • 待检索的搜索词本地Excel表:选择待检索的搜索词本地Excel表路径
  • 筛选条件:不限、最新、最热、已关注、最近读过
  • 获取数量:可自定义获取文章篇数
  • 发布日期:筛选条件为"最新"时可设置,小于该日期则停止

2、环境/工具配置

  • 电脑端提前登录某信账号
  • "待检索的搜索词本地Excel表"
  • 应用暂时只支持Windows端

3、注意事项

  • 在运行过程中,请不要进行任何操作来干预程序执行
  • 程序已添加"随机间隔"、"鼠标轨迹轻微抖动"、"随机位置点选"等配置来实现拟人化行为模拟,但交互行为的随机性并不能完全规避风控,请勿在"非合理场景+短期内频繁操作"以防触发风控/掉登录,建议使用小号

4、获取应用

*本文仅供RPA技术交流与学习,旨在分享如何通过可视化判断解决UI自动化中的"懒加载"与"元素遮挡"痛点。文中演示的流程仅为技术验证,不涉及任何规模化数据获取或商业用途。请在遵守相关平台用户协议及法律法规的前提下使用RPA工具。

-END-

  • 爱练字的ISTJ型互联网人/信息整合怪/工具人/影刀高级认证工程师。
  • 专注分享:RPA&AI自动化场景提效方案、效率软件安利、实用技能。"所有的生产要素都可以被构建,只有认知是壁垒",欢迎関注
相关推荐
Metaphor6922 小时前
Java 加密和解密 Word 文档:提升文档安全性的实用指南
经验分享
久菜盒子工作室3 小时前
【A股复盘】2025.12.30
人工智能·经验分享·金融
中屹指纹浏览器4 小时前
2025 硬核技术:中屹指纹浏览器进程级沙箱隔离,筑牢多开防关联壁垒
经验分享·笔记
漂视数字孪生世界5 小时前
项目案例|某水轮机数字孪生平台
运维·信息可视化·自动化·数字孪生·三维可视化
小钻风33665 小时前
软件测试: 从入门到实践(接口自动化)
软件测试·python·自动化
机器学习算法与Python实战6 小时前
腾讯混元OCR大模型,本地部署,实测
经验分享
紧固件研究社6 小时前
冷镦设备高产、低耗与环保并行的制造路径
自动化·制造·紧固件
视觉光源老郑6 小时前
从“看见“到“看清“,思奥特智能用技术重新定义工业视觉检测
自动化·机器视觉光源·视觉检测光源工厂
源代码•宸7 小时前
goframe框架签到系统项目开发(每日签到添加积分和积分记录、获取当月最大连续签到天数、发放连续签到奖励积分、实现签到日历详情接口)
数据库·经验分享·redis·中间件·golang·dao·goframe