python 提取PDF文字

使用pdfplumber,不能提取扫描的pdf和插入的图片。

python 复制代码
import pdfplumber

file_path = r'D:\UserData\admindesktop\官方文档\1903_Mesh-Models-Overview_FINAL.pdf'
with pdfplumber.open(file_path) as pdf:
    page = pdf.pages[0]
    print(page.extract_text()) # 所以文字
    print([word["text"] for word in page.extract_words()]) # 提取存在的文字
相关推荐
习习.y27 分钟前
python笔记梳理以及一些题目整理
开发语言·笔记·python
撸码猿34 分钟前
《Python AI入门》第10章 拥抱AIGC——OpenAI API调用与Prompt工程实战
人工智能·python·aigc
qq_386218991 小时前
Gemini生成的自动搜索和下载论文的python脚本
开发语言·python
vx_vxbs661 小时前
【SSM电影网站】(免费领源码+演示录像)|可做计算机毕设Java、Python、PHP、小程序APP、C#、爬虫大数据、单片机、文案
java·spring boot·python·mysql·小程序·php·idea
烤汉堡3 小时前
Python入门到实战:post请求+cookie+代理
爬虫·python
luod3 小时前
Python异常链
python
我不是QI4 小时前
周志华《机器学习---西瓜书》 一
人工智能·python·机器学习·ai
今天没ID4 小时前
Python 编程实战:从基础语法到算法实现 (1)
python
二川bro4 小时前
Python在AI领域应用全景:2025趋势与案例
开发语言·人工智能·python
棒棒的皮皮4 小时前
【Python】Open3d用于3D测高项目
python·3d·open3d