Python(模块+PDF)

python 复制代码
import pdfplumber
with pdfplumber.open('四级听力词汇.pdf') as pdf:
    for i in pdf.pages:
        print(i.extract_text()) #用extract_text()提取内容
        print(f'------第{i.page_number}页结束')

在使用这段代码之前要先在终端下载pdfplumber 模块,如果直接使用pip install pdfplumber下载会非常慢。可以在浏览器里搜索**清华镜像源地址,**找到pypi,复制你要下载的到你的终端先下载,这样后面下载模块的时候会非常快。

也可以直接复制粘贴一下到你的终端:

复制代码
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

在文件夹里的PDF不能直接被pycharm搜索到,可以将文件夹里的,复制粘贴到pycharm以上代码相同文件夹下。或者直接给出PDF在文件夹里的位置。

相关推荐
程序猿_极客2 分钟前
【2025 最新】 Maven 下载安装与配置教程(超详细带图文Windows 版):从入门到实战
java·开发语言·windows·maven·maven安装
励志前端小黑哥8 分钟前
uv包管理器--python也有自己的pnpm了
开发语言·python·uv
2501_9411120714 分钟前
深入理解Python的if __name__ == ‘__main__‘
jvm·数据库·python
2501_9411120516 分钟前
Python Lambda(匿名函数):简洁之道
jvm·数据库·python
小兵张健27 分钟前
Java + Spring 到 Python + FastAPI (三)
python·spring·fastapi
阿龍178735 分钟前
媒体文件问题检测脚本(一)(python+ffmpeg)
开发语言·python
速易达网络36 分钟前
flask与fastapi的区别
python
2501_941111841 小时前
分布式日志系统实现
开发语言·c++·算法
ycydynq1 小时前
python html 解析的一些写法
linux·python·html
西猫雷婶1 小时前
CNN的四维Pytorch张量格式
人工智能·pytorch·python·深度学习·神经网络·机器学习·cnn