python下载pdf

要下载 PDF 文件并将其保存到本地文件夹中,你可以使用 Python 的 requests 库来发送 HTTP 请求,并使用 osio 库来处理文件操作。以下是一个示例代码,展示了如何从给定的 URL 下载 PDF 文件并将其保存到本地 data 文件夹中:

python 复制代码
import os
import requests
from io import BytesIO

# 定义下载链接和保存路径
url = 'https://web.aacei.org/docs/default-source/rps/10S-90.pdf'
save_folder = 'data'
filename = '10S-90.pdf'
save_path = os.path.join(save_folder, filename)

# 确保保存文件夹存在
if not os.path.exists(save_folder):
    os.makedirs(save_folder)

# 发送 HTTP GET 请求获取 PDF 文件
response = requests.get(url)

# 检查请求是否成功
if response.status_code == 200:
    # 将响应内容保存到文件中
    with open(save_path, 'wb') as file:
        file.write(response.content)
    print(f"PDF 文件已成功保存到 {save_path}")
else:
    print(f"下载失败,状态码: {response.status_code}")

以下是代码的详细步骤:

  1. 导入所需的库

    • os 用于处理文件和目录。
    • requests 用于发送 HTTP 请求。
    • io.BytesIO 用于处理二进制数据(本例中未直接使用,但可以在处理更复杂的二进制文件时使用)。
  2. 定义下载链接和保存路径

    • url 是要下载的 PDF 文件的链接。
    • save_folder 是保存文件的本地文件夹。
    • filename 是要保存的 PDF 文件名。
    • save_path 是文件的完整保存路径。
  3. 确保保存文件夹存在

    • 使用 os.path.exists 检查文件夹是否存在。
    • 如果不存在,使用 os.makedirs 创建文件夹。
  4. 发送 HTTP GET 请求

    • 使用 requests.get(url) 发送 GET 请求获取 PDF 文件。
  5. 检查请求是否成功

    • 如果状态码为 200,表示请求成功。
    • 使用 with open(save_path, 'wb') as file 打开文件进行二进制写入。
    • 使用 file.write(response.content) 将响应内容写入文件。
  6. 打印成功或失败信息

    • 如果下载成功,打印成功信息。
    • 如果下载失败,打印失败信息和状态码。

运行这段代码后,PDF 文件将被下载并保存到本地 data 文件夹中。

相关推荐
老大白菜6 分钟前
Python 爬虫技术指南
python
ProtonBase9 分钟前
如何从 0 到 1 ,打造全新一代分布式数据架构
java·网络·数据库·数据仓库·分布式·云原生·架构
古希腊掌管学习的神1 小时前
[搜广推]王树森推荐系统——矩阵补充&最近邻查找
python·算法·机器学习·矩阵
LostSpeed1 小时前
在福昕(pdf)阅读器中导航到上次阅读页面的方法
pdf
旭久1 小时前
SpringBoot的Thymeleaf做一个可自定义合并td的pdf表格
pdf·html·springboot
LucianaiB2 小时前
探索CSDN博客数据:使用Python爬虫技术
开发语言·爬虫·python
PieroPc4 小时前
Python 写的 智慧记 进销存 辅助 程序 导入导出 excel 可打印
开发语言·python·excel
云和数据.ChenGuang5 小时前
Django 应用安装脚本 – 如何将应用添加到 INSTALLED_APPS 设置中 原创
数据库·django·sqlite
woshilys6 小时前
sql server 查询对象的修改时间
运维·数据库·sqlserver
Hacker_LaoYi6 小时前
SQL注入的那些面试题总结
数据库·sql