Python代码优雅解析PDF文件

主要功能:利用Python扩展库pdfplumber解析中文核心期刊要目总览.pdf文件成excel文件

解析文件:中文核心期刊要目总览.pdf

官方文档:pdfplumber · PyPI

具体代码:

python 复制代码
import pdfplumber
import pandas as pd

with pdfplumber.open("hexin.pdf") as pdf:
    print(len(pdf.pages))
    first = pdf.pages[0]
    ftable = first.extract_table()
    tables = ftable[2:]
    for page in pdf.pages[1:]:
        tables += page.extract_table()
    data_frame = pd.DataFrame(tables, columns=ftable[1])
    with pd.ExcelWriter('hexin.xlsx') as excel:
        data_frame.to_excel(excel, index=False)
相关推荐
Oueii21 小时前
Django全栈开发入门:构建一个博客系统
jvm·数据库·python
2401_831824961 天前
使用Fabric自动化你的部署流程
jvm·数据库·python
其实秋天的枫1 天前
2025年12月大学英语六级真题及答案电子版pdf三套全
经验分享·pdf
njidf1 天前
Python日志记录(Logging)最佳实践
jvm·数据库·python
@我漫长的孤独流浪1 天前
Python编程核心知识点速览
开发语言·数据库·python
宇擎智脑科技1 天前
A2A Python SDK 源码架构解读:一个请求是如何被处理的
人工智能·python·架构·a2a
2401_851272991 天前
实战:用Python分析某电商销售数据
jvm·数据库·python
vx_biyesheji00011 天前
Python 全国城市租房洞察系统 Django框架 Requests爬虫 可视化 房子 房源 大数据 大模型 计算机毕业设计源码(建议收藏)✅
爬虫·python·机器学习·django·flask·课程设计·旅游
code 小楊1 天前
yrb 1.5.0 正式发布:Python 极简国内下载加速与全景可视化终端体验!
开发语言·python
2401_857918291 天前
用Python和Twilio构建短信通知系统
jvm·数据库·python