Python(模块+PDF)

python 复制代码
import pdfplumber
with pdfplumber.open('四级听力词汇.pdf') as pdf:
    for i in pdf.pages:
        print(i.extract_text()) #用extract_text()提取内容
        print(f'------第{i.page_number}页结束')

在使用这段代码之前要先在终端下载pdfplumber 模块,如果直接使用pip install pdfplumber下载会非常慢。可以在浏览器里搜索**清华镜像源地址,**找到pypi,复制你要下载的到你的终端先下载,这样后面下载模块的时候会非常快。

也可以直接复制粘贴一下到你的终端:

复制代码
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

在文件夹里的PDF不能直接被pycharm搜索到,可以将文件夹里的,复制粘贴到pycharm以上代码相同文件夹下。或者直接给出PDF在文件夹里的位置。

相关推荐
耶啵奶膘5 小时前
uni-app头像叠加显示
开发语言·javascript·uni-app
看海天一色听风起雨落5 小时前
Python学习之装饰器
开发语言·python·学习
Want5955 小时前
C/C++圣诞树①
c语言·开发语言·c++
老赵的博客5 小时前
c++ 杂记
开发语言·c++
jimmy.hua5 小时前
[C++刷怪笼]:set/map--优质且易操作的容器
开发语言·c++
XiaoMu_0016 小时前
基于Python+Streamlit的旅游数据分析与预测系统:从数据可视化到机器学习预测的完整实现
python·信息可视化·旅游
THMAIL6 小时前
深度学习从入门到精通 - 生成对抗网络(GAN)实战:创造逼真图像的魔法艺术
人工智能·python·深度学习·神经网络·机器学习·生成对抗网络·cnn
w2sfot7 小时前
Passing Arguments as an Object in JavaScript
开发语言·javascript·ecmascript
一只花里胡哨的程序猿7 小时前
odoo打印pdf速度慢问题
pdf·odoo
郝学胜-神的一滴7 小时前
避免使用非const全局变量:C++中的最佳实践 (C++ Core Guidelines)
开发语言·c++·程序人生