[RPA] PDF文件合并

RPA需求:PDF文件合并

场景说明:根据文件前缀数字编号分组划分,发票在前,箱单在后,进行PDF文件合并操作

RPA功能

1.发票在前,箱单在后,根据文件前缀数字编号分组划分进行PDF文件合并操作

2.RPA仅对未合并的PDF文件执行合并操作,已合并的文件将被自动筛选并排除

其中PDF文件存放位置如下所示:

"原始单据"文件夹存放需要进行合并的PDF文档

"合并单据"文件夹存放RPA处理合并后的PDF文档


RPA实现思路:

① 遍历循环"合并单据"文件路径中的pdf文件,获取文件名(带后缀名.pdf)存储在Python列表output_file_list

② 遍历循环"原始单据"文件路径中的pdf文件,获取文件名(带后缀名.pdf)存储在Python列表input_file_list

③ 使用Python代码实现以下逻辑

Step 1: 提取 output_file_list 中的所有前缀数字编号,例如"80017413-001"

Step 2: 筛选 input_file_list 中前缀数字编号不包含在Step1前缀数字编号中的文件,将其箱单和发票文件名(带后缀名.pdf)存储到Python列表filtered_input_list

④ 使用Python代码实现以下逻辑

依据 filtered_input_list 提供的文件名列表,在"原始单据"文件夹中定位所有目标PDF文件,提取每个文件名开头的数字编号作为分组依据,将同组文件合并为一个 PDF,将所有合并后的新PDF文件,统一保存至"合并单据"文件夹


搭建RPA的相关指令(仅供参考):

1.循环文件路径

2.获取文件属性

3.数组处理

4.Python脚本

相关推荐
梦想的旅途27 天前
企业微信外部群自动化:基于 RPA 技术的深度解析与实现
自动化·企业微信·rpa
2501_941982057 天前
进阶指南:如何基于自动化能力进行企业通讯工具接口的二次开发
前端·机器人·自动化·企业微信·rpa
白狐_7987 天前
【实战架构】一人抵一家设计公司:基于 ComfyUI + Python RPA + Photoshop 的全自动化工业制图工作流
python·photoshop·rpa
MarkHD7 天前
RPA工程化实践:重构电商抓取项目——从混乱脚本到模块化、可配置化系统
重构·bash·rpa
MarkHD7 天前
RPA工程化实践:三种核心设计模式让复杂流程优雅可控
linux·设计模式·rpa
bitbrowser8 天前
2026年浏览器自动化(RPA)技术
安全·自动化·rpa
天空属于哈夫克38 天前
告别重复粘贴:如何利用 API 实现企业微信群公告自动更新
数据库·自动化·企业微信·rpa
曲辕RPA9 天前
曲辕RPA捕获桌面元素原理:让不支持无障碍的duilib应用变得可识别
rpa
天空属于哈夫克310 天前
释放双手:企业微信 RPA 协议级自动化深度集成方案
自动化·企业微信·rpa
wzl2026121310 天前
基于企微API与数据可视化,构建私域运营的监控与ROI分析体系
信息可视化·自动化·企业微信·rpa