Python(模块+PDF)

python 复制代码
import pdfplumber
with pdfplumber.open('四级听力词汇.pdf') as pdf:
    for i in pdf.pages:
        print(i.extract_text()) #用extract_text()提取内容
        print(f'------第{i.page_number}页结束')

在使用这段代码之前要先在终端下载pdfplumber 模块,如果直接使用pip install pdfplumber下载会非常慢。可以在浏览器里搜索**清华镜像源地址,**找到pypi,复制你要下载的到你的终端先下载,这样后面下载模块的时候会非常快。

也可以直接复制粘贴一下到你的终端:

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

在文件夹里的PDF不能直接被pycharm搜索到,可以将文件夹里的,复制粘贴到pycharm以上代码相同文件夹下。或者直接给出PDF在文件夹里的位置。

相关推荐
奈斯。zs1 分钟前
yjs08——矩阵、数组的运算
人工智能·python·线性代数·矩阵·numpy
Melody20501 分钟前
tensorflow-dataset 内网下载 指定目录
人工智能·python·tensorflow
学步_技术2 分钟前
Python编码系列—Python抽象工厂模式:构建复杂对象家族的蓝图
开发语言·python·抽象工厂模式
wn53126 分钟前
【Go - 类型断言】
服务器·开发语言·后端·golang
Narutolxy36 分钟前
Python 单元测试:深入理解与实战应用20240919
python·单元测试·log4j
Hello-Mr.Wang38 分钟前
vue3中开发引导页的方法
开发语言·前端·javascript
救救孩子把41 分钟前
Java基础之IO流
java·开发语言
WG_1742 分钟前
C++多态
开发语言·c++·面试
宇卿.1 小时前
Java键盘输入语句
java·开发语言
Amo Xiang1 小时前
2024 Python3.10 系统入门+进阶(十五):文件及目录操作
开发语言·python