python
import pdfplumber
with pdfplumber.open('四级听力词汇.pdf') as pdf:
for i in pdf.pages:
print(i.extract_text()) #用extract_text()提取内容
print(f'------第{i.page_number}页结束')
在使用这段代码之前要先在终端下载pdfplumber 模块,如果直接使用pip install pdfplumber下载会非常慢。可以在浏览器里搜索**清华镜像源地址,**找到pypi,复制你要下载的到你的终端先下载,这样后面下载模块的时候会非常快。
也可以直接复制粘贴一下到你的终端:
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
在文件夹里的PDF不能直接被pycharm搜索到,可以将文件夹里的,复制粘贴到pycharm以上代码相同文件夹下。或者直接给出PDF在文件夹里的位置。