Python(模块+PDF)

python 复制代码
import pdfplumber
with pdfplumber.open('四级听力词汇.pdf') as pdf:
    for i in pdf.pages:
        print(i.extract_text()) #用extract_text()提取内容
        print(f'------第{i.page_number}页结束')

在使用这段代码之前要先在终端下载pdfplumber 模块,如果直接使用pip install pdfplumber下载会非常慢。可以在浏览器里搜索**清华镜像源地址,**找到pypi,复制你要下载的到你的终端先下载,这样后面下载模块的时候会非常快。

也可以直接复制粘贴一下到你的终端:

复制代码
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

在文件夹里的PDF不能直接被pycharm搜索到,可以将文件夹里的,复制粘贴到pycharm以上代码相同文件夹下。或者直接给出PDF在文件夹里的位置。

相关推荐
da-peng-song8 分钟前
ArcGIS arcpy代码工具——根据属性结构表创建shape图层
javascript·python·arcgis
martian66520 分钟前
从Windows开发迁移到信创开发的指南:国产替代背景下的技术路径与实践
开发语言·科技·系统架构·系统安全·创业创新
滚雪球~21 分钟前
小市值策略复现(A股选股框架回测系统)
python·量化·策略
南玖yy26 分钟前
C++ 成员变量缺省值:引用、const 与自定义类型的初始化规则详解,引用类型和const类型的成员变量自定义类型成员是否可以用缺省值?
c语言·开发语言·c++·后端·架构·c++基础语法
大G哥1 小时前
Java 中的 Integer 缓存池:背后的性能优化机制解析
java·开发语言·缓存·性能优化
RockLiu@8051 小时前
探索PyTorch中的空间与通道双重注意力机制:实现concise的scSE模块
人工智能·pytorch·python
小虚竹1 小时前
claude 3.7,极为均衡的“全能型战士”大模型,国内直接使用
开发语言·后端·claude·claude3.7
牛马baby1 小时前
Java高频面试之并发编程-11
java·开发语言·面试
huangyuchi.1 小时前
【C++11】类的新功能
开发语言·笔记·c++11·delete·移动构造·移动赋值·deflut