Web RPA v2.2.0 | 开源网页数据采集自动化工具

Web RPA v2.2.0是一套完全开源、支持本地离线运行的网页机器人流程自动化软件,无需掌握编程知识,依靠可视化拖拽模块快速搭建自动化工作流,兼顾网页批量抓取、表单自动填充、网页自动化测试以及简易桌面操作等场景。软件整合完整的数据清洗、媒体剪辑、数据库对接、AI 智能识别全套功能,搭配键鼠录制、定时任务调度等实用组件,运营人员、数据分析师、职场办公人群都能快速搭建专属自动化流程;所有账号、密钥、配置文件仅存储在本地浏览器,全程不上传第三方服务器,从根源保障数据隐私安全。

本次更新版本为 Web RPA 控制中心 v2.2.0,整套网页机器人自动化平台提供可视化控制面板,内置启动、停止、日志查看、参数设置、GitHub 仓库入口等功能,全程无广告、无强制付费,非商用场景可永久免费使用。点击启动按钮后,程序会自动拉起后端 API 服务与前端网页编辑器,两套服务分配独立端口,默认后端端口 5241、前端端口 5921,用户可在设置界面自定义端口数值,支持多实例同时运行。

一、软件基础运行架构

1. 前后端分离部署模式

Web RPA v2.2.0 采用标准前后端分离架构,启动后分别运行后端 API 服务与可视化网页编辑器,二者占用独立端口互不干扰。端口参数支持自定义修改,同一设备可同时开启多套自动化流程,满足多站点并行采集需求。

2. 本地离线安全存储机制

工具核心优势为纯本地存储模式,账号密码、接口 Token、数据库连接密钥等隐私数据不会上传外部服务器,所有网页采集、桌面自动化任务离线执行。软件无内置广告弹窗,无功能锁付费限制,个人非商用场景完全免费开放;配套独立日志查看窗口,服务卡顿、流程执行失败时,可通过日志快速排查异常节点。

二、全场景浏览器自动化能力

整套可视化网页交互组件适配绝大多数网站,针对动态加载页面、弹窗、异步渲染控件拥有良好兼容性,完美解决传统爬虫无法抓取 JS 动态内容的痛点。

1. 基础网页操作组件

覆盖网页开关、刷新、前进后退、页面滚动滑动等基础行为;支持模拟真人点击、鼠标悬停、文本输入、下拉框选择、页面拖拽等元素交互;自带自动等待控件加载、弹窗一键关闭逻辑,搭配可视化拾取器,精准定位页面任意目标元素。

2. 批量同类元素智能采集

内置相似元素识别算法,自动识别页面结构一致的列表、商品、评论等模块,一键批量提取多条页面信息,大幅减少人工重复采集操作,适合电商竞品数据、资讯文章、评论内容批量抓取场景。

三、全方位数据采集与处理模块

1. 多维度网页信息抓取

可提取页面文字内容、超链接、图片素材等各类网页元素,支持网页全屏截图、局部区域截图,批量下载页面图片与附件文件;内置网络抓包工具,可直接解析网站接口返回原始 JSON 数据,绕过前端页面限制获取底层数据。

2. 一站式数据清洗转换工具

内置全套数据处理功能,满足采集后数据规整需求:统一变量管理、JSON 数据解析、Base64 编码解码、正则表达式精准提取指定文本;支持字符串拼接、替换、截取、大小写转换等文本处理;列表、字典数据自由增删条目,表格支持新增行列、读写单元格,采集完成的数据可直接导出 Excel 文件,无需二次转换。

3. MySQL 数据库原生交互

原生适配 MySQL 数据库,自动建立稳定连接池支撑大批量数据交互,支持自定义 SQL 语句完成数据新增、查询、修改、删除操作,抓取的数据可直接入库存储,适合长期数据监控、数据归档场景。

四、本地文件与音视频媒体处理

1. 本地文件自动化操作

无需手动操作文件夹,可批量读取本地目录文件清单,自动完成文件复制、移动、删除、重命名;支持新建文件夹、读写本地 TXT 文档,自动校验文件是否存在、读取文件大小、创建时间等属性,实现本地文件批量整理自动化。

2. 一体化音视频图像工具箱

整合完整媒体处理功能,无需额外安装剪辑软件:图片、音视频格式互相转换,音视频压缩瘦身,视频裁剪、多音轨合并;支持 M3U8 网络视频批量下载、画面旋转翻转、截取视频帧、添加水印字幕;可自定义视频倍速、分辨率,单独提取视频音频轨道,自由调整音频播放音量,适配短视频素材批量下载处理需求。

五、多层级流程逻辑控制组件

提供丰富流程编排组件,可搭建多层级、多分支复杂自动化业务流程,适配复杂多步骤采集、办公自动化场景。

  1. 多维度条件判断:支持数值、文本、运行状态对比,实现分支流程自动切换;
  2. 多元循环机制:固定次数循环、条件循环、列表逐条遍历,可随时中断或跳过单次循环;
  3. 子流程封装复用:重复执行的逻辑可封装为独立子流程反复调用,简化长流程搭建;
  4. 定时任务调度:可按小时、指定日期、自定义周期自动启动采集与自动化任务,实现无人值守运行。

六、AI 智能识别增强能力

对接多款主流大模型,搭配视觉识别技术,解决传统网页自动化难以处理的复杂验证、识别场景。

1. AI 大模型对话模块

兼容 OpenAI、智谱 AI、Deepseek、通义千问等主流大模型接口,可在自动化流程中嵌入 AI 问答、文本总结、内容分类逻辑,实现采集数据自动整理分析。

2. 视觉识别与验证码自动处理

视觉能力包含图像匹配自动点击、人脸识别、图片 OCR 文字提取;全自动处理网页各类验证码,文字验证码依靠 OCR 识别,滑块验证码可自动完成滑动验证,无需人工干预即可突破网站验证限制。

七、桌面系统自动化与人机消息交互

1. 真人键鼠模拟自动化

完整复刻真实鼠标、键盘操作逻辑,实现本地桌面软件自动化:鼠标移动、点击、拖拽、页面滚动,键盘输入文字与系统组合快捷键;内置宏录制器,一键录制全部键鼠操作并回放;支持剪贴板读写、执行本地系统命令、图像定位点击,可编写流程控制电脑关机、重启、锁屏,打通网页 + 桌面双端自动化。

2. 任务提醒与人机交互反馈

实时反馈自动化流程运行状态,提供分级日志打印、提示音、背景音乐播放、图片缩放预览功能;搭载 TTS 语音播报,实时朗读流程关键信息;可弹出自定义输入弹窗接收手动录入内容,任务全部执行完成后自动发送邮件通知,及时同步采集结果。

八、拓展辅助实用功能

补充各类小众场景拓展组件,完善自动化流程边界,覆盖更多个性化需求:

  • 支持插入自定义 JavaScript 脚本执行,调用 HTTP/API 接口对接第三方外部工具;
  • 内置随机数字生成、读取系统实时时间组件,适配数据编号、定时判断场景;
  • 流程节点支持分组、添加备注,便于后期流程维护与修改;
  • 智能超时机制,根据不同操作模块自动匹配合理等待时长,避免流程卡死;
  • 全部功能模块支持拼音、首字母检索,快速定位所需组件,降低新手操作门槛。

下载地址

夸克网盘

https://pan.quark.cn/s/3728b2b8d9e2

迅雷网盘

https://pan.xunlei.com/s/VOvO4jb2kGawd2vMEf8pLt0kA1?pwd=srrn#