python 提取PDF文字

使用pdfplumber,不能提取扫描的pdf和插入的图片。

python 复制代码
import pdfplumber

file_path = r'D:\UserData\admindesktop\官方文档\1903_Mesh-Models-Overview_FINAL.pdf'
with pdfplumber.open(file_path) as pdf:
    page = pdf.pages[0]
    print(page.extract_text()) # 所以文字
    print([word["text"] for word in page.extract_words()]) # 提取存在的文字
相关推荐
我什么都学不会29 分钟前
Python练习作业3
开发语言·python
板面华仔37 分钟前
机器学习入门(二)——逻辑回归 (Logistic Regression)
python·机器学习
Hgfdsaqwr38 分钟前
使用Flask快速搭建轻量级Web应用
jvm·数据库·python
GHZhao_GIS_RS1 小时前
python中的sort和sorted用法汇总
python·排序·列表
永恒的溪流1 小时前
环境出问题,再修改
pytorch·python·深度学习
ruxshui1 小时前
Python多线程环境下连接对象的线程安全管理规范
开发语言·数据库·python·sql
大模型玩家七七1 小时前
向量数据库实战:从“看起来能用”到“真的能用”,中间隔着一堆坑
数据库·人工智能·python·深度学习·ai·oracle
2301_763472461 小时前
使用PyQt5创建现代化的桌面应用程序
jvm·数据库·python
爱学习的阿磊1 小时前
Web开发与API
jvm·数据库·python
qq_192779871 小时前
Python多线程与多进程:如何选择?(GIL全局解释器锁详解)
jvm·数据库·python