Python代码优雅解析PDF文件

主要功能:利用Python扩展库pdfplumber解析中文核心期刊要目总览.pdf文件成excel文件

解析文件:中文核心期刊要目总览.pdf

官方文档:pdfplumber · PyPI

具体代码:

python 复制代码
import pdfplumber
import pandas as pd

with pdfplumber.open("hexin.pdf") as pdf:
    print(len(pdf.pages))
    first = pdf.pages[0]
    ftable = first.extract_table()
    tables = ftable[2:]
    for page in pdf.pages[1:]:
        tables += page.extract_table()
    data_frame = pd.DataFrame(tables, columns=ftable[1])
    with pd.ExcelWriter('hexin.xlsx') as excel:
        data_frame.to_excel(excel, index=False)
相关推荐
习习.y1 小时前
python笔记梳理以及一些题目整理
开发语言·笔记·python
撸码猿1 小时前
《Python AI入门》第10章 拥抱AIGC——OpenAI API调用与Prompt工程实战
人工智能·python·aigc
qq_386218991 小时前
Gemini生成的自动搜索和下载论文的python脚本
开发语言·python
vx_vxbs661 小时前
【SSM电影网站】(免费领源码+演示录像)|可做计算机毕设Java、Python、PHP、小程序APP、C#、爬虫大数据、单片机、文案
java·spring boot·python·mysql·小程序·php·idea
烤汉堡3 小时前
Python入门到实战:post请求+cookie+代理
爬虫·python
luod3 小时前
Python异常链
python
我不是QI4 小时前
周志华《机器学习---西瓜书》 一
人工智能·python·机器学习·ai
今天没ID4 小时前
Python 编程实战:从基础语法到算法实现 (1)
python
二川bro4 小时前
Python在AI领域应用全景:2025趋势与案例
开发语言·人工智能·python
棒棒的皮皮5 小时前
【Python】Open3d用于3D测高项目
python·3d·open3d