Python(模块+PDF)

python 复制代码
import pdfplumber
with pdfplumber.open('四级听力词汇.pdf') as pdf:
    for i in pdf.pages:
        print(i.extract_text()) #用extract_text()提取内容
        print(f'------第{i.page_number}页结束')

在使用这段代码之前要先在终端下载pdfplumber 模块,如果直接使用pip install pdfplumber下载会非常慢。可以在浏览器里搜索**清华镜像源地址,**找到pypi,复制你要下载的到你的终端先下载,这样后面下载模块的时候会非常快。

也可以直接复制粘贴一下到你的终端:

复制代码
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

在文件夹里的PDF不能直接被pycharm搜索到,可以将文件夹里的,复制粘贴到pycharm以上代码相同文件夹下。或者直接给出PDF在文件夹里的位置。

相关推荐
smj2302_7968265230 分钟前
解决leetcode第3943题递增后的数对数量
数据结构·python·算法·leetcode
এ慕ོ冬℘゜37 分钟前
JS 前端基础面试题
开发语言·前端·javascript
浩少70241 分钟前
【无标题】
java·开发语言
deepin_sir1 小时前
06 Chroma_持久化与生产环境部署实战
python
nnsix1 小时前
C# 字符串 根据换行符分割
开发语言·c#
Vallelonga1 小时前
Rust Conversion 工具 trait AsRef AsMut
开发语言·rust
Vallelonga1 小时前
Rust 中的“解引用”和智能指针与 MutexGuard 等
开发语言·rust
小鱼仙官1 小时前
Windonws 视频存储,10s/不限时
开发语言·qt·音视频
csbysj20201 小时前
框架:构建高效解决方案的基石
开发语言
wuxinyan1232 小时前
工业级大模型学习之路021:LangChain零基础入门教程(第四篇):文档加载与文本分块技术
人工智能·python·学习·langchain