技术栈

从PDF文件中提取数据

print('name')2024-10-26 11:21

笔记

python 复制代码
import pdfplumber
# 打开PDF文件
with pdfplumber.open('数学公式.pdf') as pdf:
    for i in pdf.pages: # 遍历页
        print(i.extract_text()) # extract_text()方法提取内容
        print(f'---------第{i.page_number}页结束---------')
上一篇:如何应对PDF无法转换成其他格式?常见原因与解决方法解析
下一篇:edge下默认pdf图标的修复办法
相关推荐
Moe488
12 小时前
Spring AI(1.1.0):消息元数据
java·后端·面试
老涵coding
12 小时前
测试博客111
java
aXin_ya
12 小时前
微服务 第三天
java·微服务·架构
爱学习的小囧
12 小时前
ESXi CPU 使用率高怎么排查?esxtop 一键定位占用高的虚拟机与进程
java·linux·运维·服务器·网络·虚拟化
Fanfanaas
12 小时前
Linux 进程篇 (四)
linux·运维·服务器·开发语言·c++·学习
Sylvia-girl
12 小时前
C++中类与对象
开发语言·c++
Greyson1
12 小时前
Go语言怎么用GitHub Actions_Go语言GitHub Actions教程【基础】.txt
jvm·数据库·python
qq_34229582
12 小时前
CSS如何实现单选按钮自定义样式_利用伪元素隐藏默认UI
jvm·数据库·python
良木生香
12 小时前
【C++初阶】:泛型编程的代表作---C++初阶模板
c语言·开发语言·数据结构·c++·算法
神の愛
12 小时前
@RequestParam,@RequestBody,@ResponseBody??
java
热门推荐
012026年4月技术前沿:AI大模型爆发、智能体革命与量子安全新纪元02GitHub 镜像站点032026 年 AI 编程助手全面对比评测:Cursor vs Copilot vs Claude Code vs GitHub Copilot Free04AI Weekly | 2026年4月第二周 · GitHub热门项目与AI发展趋势深度解析05GPT-6发布日深度解析-Symphony架构200万Token实战06零成本!Ollama本地部署国产大模型全指南(支持Kimi-K2.5/GLM-5/Qwen,新手秒上手)07一周AI热点速览(2026.03.31-04.06):GPT-6曝光、谷歌开源Gemma 4、资本狂飙与模型军备竞赛08从限购到畅通:GLM-5.1 Coding Plan接入攻略09从零部署 Hermes Agent:一只"会成长的 AI 马"保姆级安装教程10基于 Docker 部署 Hermes Agent 并接入飞书机器人的完整指南