RPA需求:订单数据的自动提取与标准化整理
场景说明:登录目标网站,根据指定的单据号进行检索,下载对应的数据并保存为Excel格式,对下载后的Excel文件进行数据清洗,确保数据内容符合用户规范,最终将清洗好的Excel文件批量上传至SRM系统,以便后续处理
RPA流程思路

其中搭建该RPA应用需具备以下资源:

① RPA_屏ID数据集

该RPA机器人将逐行遍历Excel数据,提取A列"DONO"中的单据号,在指定网页完成检索与文件下载,并进行数据清洗。最终生成符合规范的Excel文件,并将D列"状态"自动更新为"已完成",后续RPA机器人只会遍历去执行"状态"为空的行数据

提示Tips:若网页中检索的"DONO"单据无数据,机器人将会获得空文件,并在"状态"栏自动回填"无数据"
② "下载文件"文件夹
存储最初从指定网页Download下来的原始Excel文件,使用Python对其进行数据清洗,将清洗后的数据存入新Excel文件,重命名后移至"屏ID模板生成"文件夹,同时将原始文件移至"备份文件"文件夹
提示Tips:
③ "备份文件"文件夹
存储最初从指定网页Download下来的原始Excel文件

④ "屏ID模板生成"文件夹
存储数据清洗后的Excel结果文件

这个RPA机器人可实现"自动下载 → 数据处理 → 生成新文件 → 备份"的自动化流程,可以减少人工操作,提高工作效率和准确性

RPA功能:从相关网站下载文件,处理数据并生成和备份文件
RPA解决方案:
① 最核心的逻辑主要是使用Python获取RPA_屏ID数据集.xlsx文件的总行数data_row_num ,排除表头(起始行设置第2行,起始列设置A列;结束行设置第data_row_num行,结束列设置D列),循环读取该文件的每一行数据,抓取A栏位"DONO"中的单据号,在指定网页进行检索并下载文件, 后续完成该行RPA操作以后,D栏位"状态"将会自动回填"已完成",RPA机器人只会遍历去执行"状态"为空的行数据
② Excel数据清洗可借用Python Pandas数据分析模块,通过加入相关的Python脚本指令生成最终的目标文件
搭建RPA的相关指令(仅供参考):
1.打开网页、获取网页对象、关闭网页
2.填写输入框、填写密码框
3.点击元素
4.下载文件
5.Excel相关指令(开启Excel、读取Excel内容、写入内容到Excel、关闭Excel)
6.IF条件判断
7.文件操作相关指令(循环文件路径、获取文件属性、文件重命名、移动文件)
8.Python脚本指令