import pdfplumber
import pandas as pd
def extract_tables_to_excel(pdf_path, excel_path):
# 打开PDF文件
with pdfplumber.open(pdf_path) as pdf:
# 创建一个空的DataFrame列表,用于存储所有表格数据
all_tables = []
# 遍历PDF的每一页
for page in pdf.pages:
# 提取当前页的表格
tables = page.extract_tables()
# 将每页的表格转换为DataFrame,并添加到all_tables列表中
for table in tables:
df = pd.DataFrame(table)
all_tables.append(df)
# 将所有表格数据合并为一个DataFrame
combined_tables = pd.concat(all_tables, ignore_index=True)
# 将合并后的表格数据保存到Excel文件中
combined_tables.to_excel(excel_path, index=False)
# PDF文件路径
pdf_path = '1.pdf'
# Excel文件路径
excel_path = 'output_tables.xlsx'
# 调用函数
extract_tables_to_excel(pdf_path, excel_path)
Python应用—从pdf文件中提取表格,并且保存在excel中
翻车吧奥斯卡2024-07-21 21:45
相关推荐
极智-9964 分钟前
GitHub 热榜项目-日榜精选(2026-01-24)| AI智能体工具、Python生态等 | remotion、VibeVoice、goose等YMLT花岗岩23 分钟前
Python学习之-函数-入门训练-具有多个返回值的函数北鹤M23 分钟前
用MeteoStat计算任意时刻经纬度真实气象数据星瞳科技OpenMV27 分钟前
星瞳OpenMV官方机械臂教程|从零开始:Robot Arm机械臂快速上手写代码的【黑咖啡】1 小时前
Python中的lxml:高效XML处理库人工智能AI技术1 小时前
【Agent从入门到实践】29 开发第一个Agent——需求定义理智.6292 小时前
Cursor 中使用 Conda 虚拟环境常见问题与彻底解决方案(踩坑实录)aiguangyuan2 小时前
中文分词与文本分析实战指南小二·2 小时前
Python Web 开发进阶实战:量子机器学习实验平台 —— 在 Flask + Vue 中集成 Qiskit 构建混合量子-经典 AI 应用one____dream2 小时前
【网安】pwn-ret2shellcode