Python(模块+PDF)

python 复制代码
import pdfplumber
with pdfplumber.open('四级听力词汇.pdf') as pdf:
    for i in pdf.pages:
        print(i.extract_text()) #用extract_text()提取内容
        print(f'------第{i.page_number}页结束')

在使用这段代码之前要先在终端下载pdfplumber 模块,如果直接使用pip install pdfplumber下载会非常慢。可以在浏览器里搜索**清华镜像源地址,**找到pypi,复制你要下载的到你的终端先下载,这样后面下载模块的时候会非常快。

也可以直接复制粘贴一下到你的终端:

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

在文件夹里的PDF不能直接被pycharm搜索到,可以将文件夹里的,复制粘贴到pycharm以上代码相同文件夹下。或者直接给出PDF在文件夹里的位置。

相关推荐
斯凯利.瑞恩几秒前
Python决策树、随机森林、朴素贝叶斯、KNN(K-最近邻居)分类分析银行拉新活动挖掘潜在贷款客户附数据代码
python·决策树·随机森林
杨荧16 分钟前
【JAVA毕业设计】基于Vue和SpringBoot的服装商城系统学科竞赛管理系统
java·开发语言·vue.js·spring boot·spring cloud·java-ee·kafka
白子寰22 分钟前
【C++打怪之路Lv14】- “多态“篇
开发语言·c++
yannan2019031322 分钟前
【算法】(Python)动态规划
python·算法·动态规划
蒙娜丽宁32 分钟前
《Python OpenCV从菜鸟到高手》——零基础进阶,开启图像处理与计算机视觉的大门!
python·opencv·计算机视觉
光芒再现dev34 分钟前
已解决,部署GPTSoVITS报错‘AsyncRequest‘ object has no attribute ‘_json_response_data‘
运维·python·gpt·语言模型·自然语言处理
王俊山IT34 分钟前
C++学习笔记----10、模块、头文件及各种主题(一)---- 模块(5)
开发语言·c++·笔记·学习
为将者,自当识天晓地。36 分钟前
c++多线程
java·开发语言
小政爱学习!38 分钟前
封装axios、环境变量、api解耦、解决跨域、全局组件注入
开发语言·前端·javascript
好喜欢吃红柚子1 小时前
万字长文解读空间、通道注意力机制机制和超详细代码逐行分析(SE,CBAM,SGE,CA,ECA,TA)
人工智能·pytorch·python·计算机视觉·cnn