Python(模块+PDF)

python 复制代码
import pdfplumber
with pdfplumber.open('四级听力词汇.pdf') as pdf:
    for i in pdf.pages:
        print(i.extract_text()) #用extract_text()提取内容
        print(f'------第{i.page_number}页结束')

在使用这段代码之前要先在终端下载pdfplumber 模块,如果直接使用pip install pdfplumber下载会非常慢。可以在浏览器里搜索**清华镜像源地址,**找到pypi,复制你要下载的到你的终端先下载,这样后面下载模块的时候会非常快。

也可以直接复制粘贴一下到你的终端:

复制代码
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

在文件夹里的PDF不能直接被pycharm搜索到,可以将文件夹里的,复制粘贴到pycharm以上代码相同文件夹下。或者直接给出PDF在文件夹里的位置。

相关推荐
Y1rong1 小时前
C++ QT之记事本
开发语言·qt
吴佳浩4 小时前
大模型量化部署终极指南:让700亿参数的AI跑进你的显卡
人工智能·python·gpu
diegoXie5 小时前
Python / R 向量顺序分割与跨步分割
开发语言·python·r语言
程序员小白条5 小时前
0经验如何找实习?
java·开发语言·数据结构·数据库·链表
七牛云行业应用5 小时前
解决OSError: No space left... 给DeepSeek Agent装上无限云硬盘
python·架构设计·七牛云·deepseek·agent开发
liulilittle5 小时前
C++ 浮点数封装。
linux·服务器·开发语言·前端·网络·数据库·c++
BoBoZz195 小时前
CutWithScalars根据标量利用vtkContourFilter得到等值线
python·vtk·图形渲染·图形处理
失散136 小时前
Python——1 概述
开发语言·python
萧鼎6 小时前
Python 图像哈希库 imagehash——从原理到实践
开发语言·python·哈希算法
qq_251533596 小时前
使用 Python 提取 MAC 地址
网络·python·macos