PySimpleGUI界面读取PDF转换Excel

PySimpleGUI 是一个用于创建图形用户界面的 Python 库,而 PDF 文件和 Excel 文件是两种不同的数据格式。要将 PDF 文件转换为 Excel 文件,你需要使用额外的库,如 pdf2excel

下面是一个示例流程,展示了如何使用 PySimpleGUI 创建一个界面,以便用户选择 PDF 文件并读取其中的数据,然后将其导入 Excel 文件:

  1. 安装所需的库
复制代码

bash复制代码

|---|----------------------------------------------|
| | pip install PySimpleGUI pdf2excel openpyxl |

  1. 使用 PySimpleGUI 创建界面
复制代码

python复制代码

|---|-----------------------------------------------------------------------------------------------------------------|
| | import PySimpleGUI as sg |
| | |
| | # 定义列和行布局 |
| | layout = [[sg.Column([[sg.Text("选择 PDF 文件:")], [sg.In(key='-IN-')]], pad=(0,0))], |
| | [sg.Text("选择输出 Excel 文件:")], |
| | [sg.In(key='-OUT-')], |
| | [sg.Column([[sg.Text("开始转换")], [sg.FileBrowse(file_types=(("PDF files", "*.pdf"), ("All files", "*.*")))]])] |
| | |
| | # 创建窗口布局 |
| | window = sg.Window("PDF to Excel Converter", layout, margins=(0,0), finalize=True) |
| | |
| | # 事件循环 |
| | while True: |
| | event, values = window.read() |
| | if event == sg.WINDOW_CLOSED: |
| | break |
| | elif event == "-IN-": |
| | input_file = values['-IN-'] |
| | elif event == "-OUT-": |
| | output_file = values['-OUT-'] |
| | elif event == "FileSelected": |
| | # 使用 pdf2excel 进行转换 |
| | pdf2excel(input_file, output_file) |
| | sg.popup_error("转换完成!") |

  1. 使用 pdf2excel 进行转换 :请注意,pdf2excel 是一个独立的库,它负责实际的 PDF 到 Excel 的转换。你可能需要自己编写这部分逻辑,或者找到一个合适的库。如果 pdf2excel 不满足你的需求,你可能需要查找其他库或工具来完成这个任务。

  2. 保存 Excel 文件 :在上述代码中,我们使用了 openpyxl 来保存 Excel 文件。你可以使用以下代码作为参考:

复制代码

python复制代码

|---|-------------------------------------------------|
| | from openpyxl import Workbook |
| | from openpyxl.utils import get_column_letter |
| | |
| | def save_to_excel(data, filename): |
| | wb = Workbook() |
| | ws = wb.active |
| | for r in data: |
| | ws.append(r) |
| | wb.save(filename) |

在完整的程序中,你需要根据实际的 PDF 文件内容和格式来调整这个函数,使其能够正确地将数据保存到 Excel 文件中。

  1. 处理异常和错误 :在实际应用中,你应该添加异常处理逻辑,以便在转换过程中出现错误时给出清晰的错误消息。这可能涉及到捕获 pdf2excel 库可能抛出的任何异常。

  2. 关闭窗口 :在程序结束时,确保关闭 PySimpleGUI 窗口。你可以在 sg.Windowclose 方法中添加适当的逻辑来处理这一点。

  3. 测试和调试:在实际部署之前,确保对程序进行彻底的测试和调试,以确保其按预期工作。

相关推荐
CodeCraft Studio18 分钟前
PDF处理控件Aspose.PDF教程:使用 Python 将 PDF 转换为 Base64
开发语言·python·pdf·base64·aspose·aspose.pdf
Light602 小时前
领码方案|Linux 下 PLT → PDF 转换服务超级完整版:异步、权限、进度
linux·pdf·可观测性·异步队列·plt转pdf·权限治理·进度查询
ftswsfb2 小时前
PDF文件基础-计算机字体
pdf
John_ToDebug2 小时前
定制 ResourceBundle 的实现与 DuiLib 思想在 Chromium 架构下的应用解析
c++·chrome·ui
十碗饭吃不饱4 小时前
net::ERR_EMPTY_RESPONSE
java·javascript·chrome·html5
虎头金猫6 小时前
如何在Linux上使用Docker在本地部署开源PDF工具Stirling PDF:StirlingPDF+cpolar让专业操作像在线文档一样简单
linux·运维·ubuntu·docker·pdf·开源·centos
懵逼的小黑子11 小时前
excel里面店铺这一列的数据结构是2C【uniteasone17】这种,我想只保留前面的2C部分,后面的【uniteasone17】不要
excel
拓端研究室13 小时前
专题:2025人形机器人、工业机器人、智能焊接机器人、扫地机器人产业洞察报告 | 附158+份报告PDF、数据仪表盘汇总下载
microsoft·机器人·pdf
babytiger14 小时前
python 通过selenium调用chrome浏览器
前端·chrome
TextIn智能文档云平台14 小时前
复杂PDF文档结构化提取全攻略——从OCR到大模型知识库构建
pdf·ocr