Python(模块+PDF)

python 复制代码
import pdfplumber
with pdfplumber.open('四级听力词汇.pdf') as pdf:
    for i in pdf.pages:
        print(i.extract_text()) #用extract_text()提取内容
        print(f'------第{i.page_number}页结束')

在使用这段代码之前要先在终端下载pdfplumber 模块,如果直接使用pip install pdfplumber下载会非常慢。可以在浏览器里搜索**清华镜像源地址,**找到pypi,复制你要下载的到你的终端先下载,这样后面下载模块的时候会非常快。

也可以直接复制粘贴一下到你的终端:

复制代码
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

在文件夹里的PDF不能直接被pycharm搜索到,可以将文件夹里的,复制粘贴到pycharm以上代码相同文件夹下。或者直接给出PDF在文件夹里的位置。

相关推荐
AI攻城狮2 小时前
用 Playwright 实现博客一键发布到稀土掘金
python·自动化运维
曲幽2 小时前
FastAPI分布式系统实战:拆解分布式系统中常见问题及解决方案
redis·python·fastapi·web·httpx·lock·asyncio
孟健17 小时前
Karpathy 用 200 行纯 Python 从零实现 GPT:代码逐行解析
python
码路飞19 小时前
写了个 AI 聊天页面,被 5 种流式格式折腾了一整天 😭
javascript·python
曲幽1 天前
FastAPI压力测试实战:Locust模拟真实用户并发及优化建议
python·fastapi·web·locust·asyncio·test·uvicorn·workers
敏编程1 天前
一天一个Python库:jsonschema - JSON 数据验证利器
python
前端付豪1 天前
LangChain记忆:通过Memory记住上次的对话细节
人工智能·python·langchain
databook1 天前
ManimCE v0.20.1 发布:LaTeX 渲染修复与动画稳定性提升
python·动效
花酒锄作田2 天前
使用 pkgutil 实现动态插件系统
python