技术栈

从PDF文件中提取数据

print('name')2024-10-26 11:21

笔记

python 复制代码
import pdfplumber
# 打开PDF文件
with pdfplumber.open('数学公式.pdf') as pdf:
    for i in pdf.pages: # 遍历页
        print(i.extract_text()) # extract_text()方法提取内容
        print(f'---------第{i.page_number}页结束---------')
上一篇:如何应对PDF无法转换成其他格式?常见原因与解决方法解析
下一篇:edge下默认pdf图标的修复办法
相关推荐
Moe488
几秒前
Spring AI(1.1.0):消息元数据
java·后端·面试
老涵coding
2 分钟前
测试博客111
java
aXin_ya
2 分钟前
微服务 第三天
java·微服务·架构
爱学习的小囧
4 分钟前
ESXi CPU 使用率高怎么排查?esxtop 一键定位占用高的虚拟机与进程
java·linux·运维·服务器·网络·虚拟化
Fanfanaas
5 分钟前
Linux 进程篇 (四)
linux·运维·服务器·开发语言·c++·学习
Sylvia-girl
6 分钟前
C++中类与对象
开发语言·c++
Greyson1
7 分钟前
Go语言怎么用GitHub Actions_Go语言GitHub Actions教程【基础】.txt
jvm·数据库·python
qq_34229582
7 分钟前
CSS如何实现单选按钮自定义样式_利用伪元素隐藏默认UI
jvm·数据库·python
良木生香
9 分钟前
【C++初阶】:泛型编程的代表作---C++初阶模板
c语言·开发语言·数据结构·c++·算法
神の愛
9 分钟前
@RequestParam,@RequestBody,@ResponseBody??
java
热门推荐
012026年4月技术前沿:AI大模型爆发、智能体革命与量子安全新纪元02GitHub 镜像站点032026 年 AI 编程助手全面对比评测:Cursor vs Copilot vs Claude Code vs GitHub Copilot Free04GPT-6发布日深度解析-Symphony架构200万Token实战05AI Weekly | 2026年4月第二周 · GitHub热门项目与AI发展趋势深度解析06一周AI热点速览(2026.03.31-04.06):GPT-6曝光、谷歌开源Gemma 4、资本狂飙与模型军备竞赛07零成本!Ollama本地部署国产大模型全指南(支持Kimi-K2.5/GLM-5/Qwen,新手秒上手)08基于 Docker 部署 Hermes Agent 并接入飞书机器人的完整指南09从限购到畅通:GLM-5.1 Coding Plan接入攻略10GPT-6核心能力解析及与现有主流大模型对比