python爬取pdf文件并保存至本地

问题描述 :python爬取pdf文件并保存至本地,目标网址下有一系列pdf 文件,其中"1.pdf "为想要保存的pdf文件,并且想要保存的pdf是多个pdf,pdf的文件名随着网址中的"1.pdf "变化而变化,规律是依次增加,比如"1.pdf "、"2.pdf "、"3.pdf "...,现在想要通过循环改变网址来保存这些pdf。

python 复制代码
# -*- coding: utf-8 -*-
"""
@author: cattt3
"""

import requests
from bs4 import BeautifulSoup

# 目标网址
url = "http://xxx.cn/Course/TeachingCourse/PsychStats/"

# 循环从1开始,直到找不到PDF文件
i = 1
while True:
    # 构建完整的PDF文件名
    pdf_filename = f"{i}.pdf"

    # 构建完整的PDF URL
    pdf_url = url + pdf_filename

    # 发送HTTP请求
    response = requests.get(pdf_url)

    # 如果请求成功,保存PDF文件
    if response.status_code == 200:
        with open(pdf_filename, "wb") as f:
            f.write(response.content)
        print(f"已保存 {pdf_filename}")
    else:
        # 如果请求失败,停止循环
        break

    # 增加文件名计数器
    i += 1

保存成功:

相关推荐
星空椰7 小时前
Python 面向对象高级:继承与类定义详解
开发语言·python
凯瑟琳.奥古斯特7 小时前
高阶子查询题目精炼
开发语言·数据库·python·职场和发展·数据库开发
风之所往_7 小时前
Python 3.4 新特性全面总结
python
太阳上的雨天8 小时前
任何格式的文件转Markdown
python·ai
yaoxin5211238 小时前
419. 现代 Java IO 最佳实践 - 写入文本文件
java·windows·python
跨境数据猎手8 小时前
Superbuy淘宝代购集运系统架构拆解,复刻方案参考
爬虫·架构·系统架构
weixin_468466858 小时前
纳米 AI 搜索新手极速上手指南
人工智能·python·深度学习·搜索引擎·ai·语言模型·自然语言处理
凯瑟琳.奥古斯特9 小时前
数据库原理选择题精选
数据库·python·职场和发展
彦为君9 小时前
JavaSE-07-异常机制
java·开发语言·后端·python·spring