phtyon读取pdf的远程地址解析内容

import xlwt,pymysql,requests,json,datetime,PyPDF2,urllib.request,io,ssl

添加context 解决读取pdf时SSL报错问题

context = ssl._create_unverified_context()

读取pdf地址 获取pdf内容

req = urllib.request.urlopen(contract_download_url,context=context)

remote_file=req.read()

memory_file = io.BytesIO(remote_file)

read_pdf = PyPDF2.PdfReader(memory_file)

获取pdf页数

number_of_pages = len(read_pdf.pages)

for i in range(0, number_of_pages):

pageObj = read_pdf.pages[i]

获取当前页数的pdf内容

page = pageObj.extract_text()

处理后续业务流程 .......................

相关推荐
Empty_77710 小时前
编程之python基础
开发语言·python
哲Zheᗜe༘13 小时前
了解学习Python编程之python基础
开发语言·python·学习
麦麦大数据14 小时前
F024 RNN+Vue+Flask电影推荐可视化系统 python flask mysql 深度学习 echarts
python·rnn·深度学习·vue·echarts·电影推荐
Roc-xb14 小时前
ModuleNotFoundError: No module named ‘conda_token‘
开发语言·python·conda
weixin_5259363315 小时前
部分Spark SQL编程要点
大数据·python·sql·spark
Xyz996_15 小时前
python编程基础知识
python
人工干智能15 小时前
Python 开发中:`.ipynb`(Jupyter Notebook 文件)和 `.py`(Python 脚本文件)
开发语言·python·jupyter
woshihonghonga15 小时前
Jupyter Notebook单元格输出换行问题解决
ide·python·jupyter
~~李木子~~15 小时前
Jupyter Notebook(ipynb)转 Python(py)文件
python·jupyter
ERROR_LESS15 小时前
【ADS-1】【python基础-1】jupyter notebook环境极简搭建
python·jupyter