技术栈

从PDF文件中提取数据

print('name')2024-10-26 11:21

笔记

python 复制代码
import pdfplumber
# 打开PDF文件
with pdfplumber.open('数学公式.pdf') as pdf:
    for i in pdf.pages: # 遍历页
        print(i.extract_text()) # extract_text()方法提取内容
        print(f'---------第{i.page_number}页结束---------')
上一篇:如何应对PDF无法转换成其他格式?常见原因与解决方法解析
下一篇:edge下默认pdf图标的修复办法
相关推荐
call me by ur name
13 小时前
ERNIE 5.0 Technical Report论文解读
android·开发语言·人工智能·机器学习·ai·kotlin
dog250
13 小时前
细看高维空间中距离度量失效
开发语言·php
码云数智-大飞
13 小时前
Rust的所有权模型如何消除内存安全问题?与C++的RAII有何异同?
开发语言
如意猴
13 小时前
【前端】002--怎样制作一个简历界面?
开发语言·前端·javascript
阿维的博客日记
13 小时前
为什么不逃逸代表不需要锁,JIT会直接删掉锁
java
William Dawson
13 小时前
CAS的底层实现
java
夜珀
13 小时前
OpenTiny NEXT 从入门到精通·第 6 篇
开发语言·前端框架
JaydenAI
13 小时前
[Python编程思想与技巧-01]我所理解的Python元模型
python·元宇宙·元类·元模型
九英里路
13 小时前
cpp容器——string模拟实现
java·前端·数据结构·c++·算法·容器·字符串
YDS829
13 小时前
大营销平台 —— 抽奖前置规则过滤
java·spring boot·ddd
热门推荐
01GitHub 镜像站点02一周AI热点速览(2026.03.31-04.06):GPT-6曝光、谷歌开源Gemma 4、资本狂飙与模型军备竞赛03基于 Docker 部署 Hermes Agent 并接入飞书机器人的完整指南04OpenClaw 请求超时 llm request timed out 怎么解决?3 种方案实测,附完整排查流程05VMware Workstation Pro 17 虚拟机完整安装教程(2026最新)06CodeBuddy与WorkBuddy深度对比:腾讯两款AI工具差异及实操指南07实测!Gemma 4 成功跑在安卓手机上:离线 AI 助手终于来了08Oh My Codex 快速使用指南09AI Weekly | 2026年4月第二周 · GitHub热门项目与AI发展趋势深度解析10开发者环境配置:用 Ollama 实现本地大模型部署(附下载慢的解决方案