python爬取pdf文件并保存至本地

问题描述 :python爬取pdf文件并保存至本地,目标网址下有一系列pdf 文件,其中"1.pdf "为想要保存的pdf文件,并且想要保存的pdf是多个pdf,pdf的文件名随着网址中的"1.pdf "变化而变化,规律是依次增加,比如"1.pdf "、"2.pdf "、"3.pdf "...,现在想要通过循环改变网址来保存这些pdf。

python 复制代码
# -*- coding: utf-8 -*-
"""
@author: cattt3
"""

import requests
from bs4 import BeautifulSoup

# 目标网址
url = "http://xxx.cn/Course/TeachingCourse/PsychStats/"

# 循环从1开始,直到找不到PDF文件
i = 1
while True:
    # 构建完整的PDF文件名
    pdf_filename = f"{i}.pdf"

    # 构建完整的PDF URL
    pdf_url = url + pdf_filename

    # 发送HTTP请求
    response = requests.get(pdf_url)

    # 如果请求成功,保存PDF文件
    if response.status_code == 200:
        with open(pdf_filename, "wb") as f:
            f.write(response.content)
        print(f"已保存 {pdf_filename}")
    else:
        # 如果请求失败,停止循环
        break

    # 增加文件名计数器
    i += 1

保存成功:

相关推荐
hnxaoli4 小时前
win10小程序(十八)剪切板循环粘贴
python·小程序
APIshop4 小时前
Java获取淘宝商品价格、图片与视频:淘宝开放平台API实战指南
开发语言·python
程序员老邢4 小时前
【产品底稿 04】商助慧 V1.1 里程碑:爬虫入库 + MySQL + Milvus 全链路打通
java·爬虫·mysql·ai·springboot·milvus
唐叔在学习4 小时前
Python移动端应用消息提醒开发实践
开发语言·python
好家伙VCC4 小时前
**发散创新:基于Python与OpenCV的视频流帧级分析实战**在当前人工智能与计算机视觉飞速发展的背景下
java·人工智能·python·计算机视觉
xiaotao1314 小时前
阶段零:IDE选择 与 Jupyter Notebook / Lab 使用
ide·人工智能·python·jupyter
琪伦的工具库4 小时前
批量PDF合并工具使用说明:批量合并与直接合并两种模式,拖拽排序/页面范围/遍历子目录/重名自动处理
数据结构·pdf·排序算法
Pocker_Spades_A4 小时前
Python快速入门专业版(五十七)——POST请求与模拟登录:从表单分析到实战(以测试网站为例)
开发语言·python
Highcharts.js4 小时前
企业级数据可视化|BI 仪表板数据中台工业监控平台的选择分析
人工智能·python·信息可视化·数据挖掘·数据分析·highcharts
橙露4 小时前
Seaborn 高级可视化:统计图表制作与报告导出
python