用影刀RPA获取公呺搜索关键词文章数据,如何判断文章条目元素是否在可视区域?| 文章列表的循环点击方案拆解

用影刀RPA做公呺自动化时,一个非常典型的需求场景是:按一组关键词,在某信搜一搜中自动化获取公呺文章的公开数据。

整体流程看起来很清楚:搜索关键词、切换筛选条件、进入文章、提取字段,再写入 Excel 表格。

这些步骤本身都不复杂,但真正尝试过搭建这套RPA流程的新手,**几乎都会卡在同一个地方------搜索结果页的文章列表。**文章条目明明都能获取到,但循环点击处理几篇文章后,就开始出现点空、点偏,导致整个应用无法正常执行下去。

下面我会围绕这个场景,讲一下自己搭建的这个"公呺关键词搜索文章公开数据获取 RPA机器人",并重点分享"实现稳定循环点击每篇文章"的解决思路

一、应用介绍

这是一款基于影刀RPA开发的"公呺关键词搜索文章公开数据获取RPA应用(桌面自动化)"。

用户简单配置启动参数,程序就会自动激活某信窗口,在某信搜一搜中搜索关键词、匹配筛选条件,并逐篇打开公呺文章,抓取核心公开信息字段并写入表格。

目前支持的具体功能点:

  • 支持从 EXCEL 循环导入多行关键词:按配置顺序逐条读取关键词,在某信搜一搜中自动执行获取流程。
  • **支持完整获取公呺文章公开字段:**当前可获取字段包括:文章标题、文章链接、发布时间、阅读量、点赞数、分享数、在看数、留言数等
  • **支持5 种搜索结果筛选模式:**可按需求切换:不限、最新、最热、已关注、最近读过。
  • 支持自定义获取文章数量:可自定义设置获取文章篇数。
  • 支持按"最新"条件限定时间范围获取 :在选择"最新"筛选模式下,可指定仅获取 某自定义截止日期内的文章公开数据,如"近 7 天、近 30 天"发布的文章。
  • 内置文章列表可视区域判断与动态滚动机制 :自动判断文章元素是否完整处于安全点击区:在可视区域内 → 直接点击,超出可视区域 → 自动滚动页面并重新定位后点击

二、运行演示

这里以"品牌营销"这个搜索词为例,获取10篇文章,具体运行效果如下:

(*审核失败)

三、流程搭建

1、流程指令长图

2、核心难点("循环点击")

某信搜索结果页的文章列表应用了懒加载技术,能不能顺利点击,取决于它是否完整地落在"安全点击区(可视区域)"内,而不是你有没有拿到这个元素。

我们用一个最直观的场景来理解。

假设你的电脑屏幕高度为:900px,其中:电脑任务栏高度为40px,某信窗口高度为860px。(*其中"浏览器&页面容器层"高度为40px、"搜一搜顶部功能区&搜索结果类型导航区"高度为110px、"搜索结果筛选排序区&文章列表区"高度为710px)

而某信窗口的文章条目可见区域里(高度在"150-860px")只能同时显示有限数量的文章,比如 5 篇文章。

那么,前5篇文章因为在屏幕可视区域内,就能顺利点击。而后面的文章条目,虽然你前面也能通过"获取相似元素列表(Win)"指令获取到,但程序执行循环点击时是基于"坐标位置"在点的。

后面的文章条目并未出现在可视区域内,即"程序点的位置,已经不在屏幕里了",这就会导致出现:实际点击到下方电脑任务栏的情况,流程卡死执行不下去。

那么我们对应的处理思路也很明晰了,就是:判断当前循环到的文章条目是否完整的落在可视区域内。

这个判断放到影刀RPA中,就是"坐标位置"必须同时满足:文章条目元素.Top > 可见区域元素.Top ,并且文章条目元素.Bottom < 可见区域元素.Bottom

若满足,则点击文章执行获取,直至当前可视区域内的文章处理完。若不满足,则滚动页面,让新的文章进入安全区,重复以上流程,再获取一次文章条目的坐标,再判断--再点击--再滚动......

*总结:文章条目列表可以很长,但点击只能发生在可视区域内。超过显示范围的文章,必须先滚进屏幕,再进行点击。所以正确做法不是"一直往下点",而是"点一屏,滚一屏"。

四、如何获取 & 应用?

1、启动参数说明

启动应用后,用户需要依次输入或选择以下参数:

  • 待检索的搜索词本地Excel表:选择待检索的搜索词本地Excel表路径
  • 筛选条件:不限、最新、最热、已关注、最近读过
  • 获取数量:可自定义获取文章篇数
  • 发布日期:筛选条件为"最新"时可设置,小于该日期则停止

2、环境/工具配置

  • 电脑端提前登录某信账号
  • "待检索的搜索词本地Excel表"
  • 应用暂时只支持Windows端

3、注意事项

  • 在运行过程中,请不要进行任何操作来干预程序执行
  • 程序已添加"随机间隔"、"鼠标轨迹轻微抖动"、"随机位置点选"等配置来实现拟人化行为模拟,但交互行为的随机性并不能完全规避风控,请勿在"非合理场景+短期内频繁操作"以防触发风控/掉登录,建议使用小号

4、获取应用

*本文仅供RPA技术交流与学习,旨在分享如何通过可视化判断解决UI自动化中的"懒加载"与"元素遮挡"痛点。文中演示的流程仅为技术验证,不涉及任何规模化数据获取或商业用途。请在遵守相关平台用户协议及法律法规的前提下使用RPA工具。

-END-

  • 爱练字的ISTJ型互联网人/信息整合怪/工具人/影刀高级认证工程师。
  • 专注分享:RPA&AI自动化场景提效方案、效率软件安利、实用技能。"所有的生产要素都可以被构建,只有认知是壁垒",欢迎関注
相关推荐
一个人旅程~3 天前
如何用命令行把win10/win11设置为长期暂停更新?
linux·windows·经验分享·电脑
Factory_Audit3 天前
亚马逊社会责任验厂审核标准及注意事项
大数据·经验分享
江南小书生3 天前
制造业系统赋能成熟度自测表(实操版)
经验分享·非标制造
金智维科技官方3 天前
智能体,重构企业自动化未来
人工智能·自动化·agent·智能体·数字员工
实在智能RPA3 天前
从 User-Agent 到 AI Agent:2026年企业级自动化架构的范式转移与实战深度解析
人工智能·ai·rpa
梦想的旅途23 天前
企业微信API:外部群自动化推送实战指南
大数据·机器人·自动化·企业微信·rpa
三流架构师3 天前
述职报告资源合集
经验分享
xiaoginshuo3 天前
流程自动化从传统RPA升级到AI Agent,如何匹配合适的自动化方案
人工智能·自动化·rpa
W-琑3 天前
软件测试-自动化测试
功能测试·自动化
牛奶咖啡133 天前
DevOps自动化运维实践_使用再生龙对Linux系统进行备份还原
运维·自动化·devops·linux系统的备份还原·linux系统克隆备份·再生龙