[RPA] PDF文件合并

RPA需求:PDF文件合并

场景说明:根据文件前缀数字编号分组划分,发票在前,箱单在后,进行PDF文件合并操作

RPA功能

1.发票在前,箱单在后,根据文件前缀数字编号分组划分进行PDF文件合并操作

2.RPA仅对未合并的PDF文件执行合并操作,已合并的文件将被自动筛选并排除

其中PDF文件存放位置如下所示:

"原始单据"文件夹存放需要进行合并的PDF文档

"合并单据"文件夹存放RPA处理合并后的PDF文档


RPA实现思路:

① 遍历循环"合并单据"文件路径中的pdf文件,获取文件名(带后缀名.pdf)存储在Python列表output_file_list

② 遍历循环"原始单据"文件路径中的pdf文件,获取文件名(带后缀名.pdf)存储在Python列表input_file_list

③ 使用Python代码实现以下逻辑

Step 1: 提取 output_file_list 中的所有前缀数字编号,例如"80017413-001"

Step 2: 筛选 input_file_list 中前缀数字编号不包含在Step1前缀数字编号中的文件,将其箱单和发票文件名(带后缀名.pdf)存储到Python列表filtered_input_list

④ 使用Python代码实现以下逻辑

依据 filtered_input_list 提供的文件名列表,在"原始单据"文件夹中定位所有目标PDF文件,提取每个文件名开头的数字编号作为分组依据,将同组文件合并为一个 PDF,将所有合并后的新PDF文件,统一保存至"合并单据"文件夹


搭建RPA的相关指令(仅供参考):

1.循环文件路径

2.获取文件属性

3.数组处理

4.Python脚本

相关推荐
宝桥南山3 小时前
Power Platform - 恢复Developer environment
microsoft·微软·azure·rpa
山茶花开时。4 小时前
[RPA] 定时迁移PDF文件
rpa
科技云报道1 天前
科技云报到:单证处理困境:RPA+Agent融合成破局关键
科技·rpa
天空属于哈夫克32 天前
企微API+RPA(机器人流程自动化)高效实战指南
linux·运维·服务器·自动化·企业微信·rpa
oh,huoyuyan2 天前
火语言 RPA:英数图形验证码自动化处理案例
自动化·rpa
浩子智控3 天前
不同RPA实现技术的比较
软件工程·rpa
gf13211113 天前
python_生成RPA运行数据报告
windows·python·rpa
言無咎3 天前
传统财务RPA陷入性能瓶颈?AI财务机器人用LLM重构智能财税
人工智能·机器人·rpa
言無咎3 天前
RPA财务机器人已OUT?2026掌金AI以多模态LLM重构财税自动化
人工智能·机器人·rpa