"找对标"是所有成熟创作者的基本功。继某音、某书的RPA自动化数据采集分享后,今天我们来啃一啃公/仲/呺这块硬骨头。
- 批量采集某书对标账号作品数据,14个数据字段+多条件筛选+导出Excel,盯竞品、做调研、搞二创都用得上!| 影刀RPA
- 批量采集某音对标账号作品数据,14个数据字段+多条件筛选+导出Excel,盯竞品、做调研、搞二创都用得上!| 影刀RPA
为什么说是硬骨头?因为公/仲/呺是相对封闭的,它不像前面两个平台,有网页版内容社区给你刷,文章及其数据都放一块。
你可能也在网上搜到过一些基于API接口进行采集的付费工具(比如爱某助),我早些时候也试过几款,但其中多数已经失效了:接口一变,工具就挂;开发者赚不到钱,也没动力长期维护,跑路就成了常态。

与其被动依赖不稳定的第三方,不如自己掌握核心技术。今天我们换种免费、可控的方式------用影刀RPA来自动化获取。
一、需求分析
经过对公/仲/呺各个入口的拆解,我发现公/仲/呺创作者后台有个"隐藏"的数据入口------就是在"编辑文章页面"插入"超链接"的时候,其实是可以检索其他账号文章的!
虽然这里只能拿到"文章链接、文章标题、发布时间 "这三个基础字段,但这正是我们这套自动化方案的关键一步。至于阅读数、点赞数、在看数等深度互动数据,我们可以去微信PC端的"微信搜一搜"页面获取。
到这里,我们的处理策略很明晰了:
- 利用"网页端-公/仲/呺创作者后台-超链接"入口:获取文章标题、链接和发布时间。
- 利用"PC端-微信-搜一搜":补充获取阅读数/点赞数/在看数等互动数据。
由于篇幅和逻辑不同,我将分两期拆解。今天这篇是第1期,我们先解决"有什么"的问题。
二、应用介绍
这是一款基于影刀RPA搭建的公/仲/呺对标账号文章采集自动化机器人,你只需要输入对标账号名称或ID,程序就会自动检索、翻页获取文章内容,并导出Excel表格到本地桌面,整个流程无需人工干预。

三、运行演示
这里以采集"影刀RPA"官方公/仲/呺文章为例,具体运行效果如下:
四、流程拆解
综合整个操作步骤来看,大致逻辑如下:(*这里我没写登陆流程,你手动扫码登一下就行,我们从"公/仲/呺创作者后台"页面开始)。
1. 操作步骤拆解
1)在"**公/仲/呺管理后台页面-新的创作"**下面找到并点击「文章」入口。

2)在打开的新网页中,找到并点击顶部工具导航栏的「超链接」。

3)在弹出的窗口中点击「选择其他账号」按钮。

4)在搜索框里面输入你要采集的对标公/仲/呺名称/公/仲/呺ID ,回车后选中搜索结果第一项,就会显示该账号发布的文章 。


5)开始翻页采集文章,具体到采集方式,你可以用"批量数据抓取"指令,也可以使用我下面流程截图中的"魔法指令"。

6)导出本地Excel表格,表格命名格式:公/仲/呺名称_检索日期.xlsx

2. 全流程指令截图

五、如何获取 & 应用?
1、启动参数说明
- 对标公/仲/呺名称:输入对标账号名称/ID
- 请选择浏览器类型:支持指定主流浏览器运行
- 采集作品数量:采集数量达到设定阈值,则停止采集(*整数)
- 指定发布日期的文章:过滤掉不在此发布时间区间的文章
2、使用环境 / 工具配置
为了保证机器人运行稳定,需满足下面这几个基础环境:
- 需要影刀RPA账号
- 使用Chrome 浏览器或其他支持的浏览器。
- 安装影刀自动化插件,软件右上角头像点击 [工具-自动化插件]。
- 公/仲/呺创作者中心网页版提前登录账号。
- 应用暂时只支持 Windows 端。
3、使用注意事项
- 在运行过程中,请不要切换或关闭浏览器页面。
- 流程中需要考虑一种特殊、且比较普遍的情况:由于各种原因,号主会删除部分已发表的文章,但在这里的检索结果中,它仍然"被计入页码数统计",但是不会显示,页面会显示"暂无数据"。

-END-
- 爱练字的ISTJ型互联网人/信息整合怪/工具人/影刀高级认证工程师。
- 专注分享:RPA&AI自动化场景提效方案、效率软件安利、实用技能。"所有的生产要素都可以被构建,只有认知是壁垒",欢迎関注