python爬取pdf文件并保存至本地

问题描述 :python爬取pdf文件并保存至本地,目标网址下有一系列pdf 文件,其中"1.pdf "为想要保存的pdf文件,并且想要保存的pdf是多个pdf,pdf的文件名随着网址中的"1.pdf "变化而变化,规律是依次增加,比如"1.pdf "、"2.pdf "、"3.pdf "...,现在想要通过循环改变网址来保存这些pdf。

python 复制代码
# -*- coding: utf-8 -*-
"""
@author: cattt3
"""

import requests
from bs4 import BeautifulSoup

# 目标网址
url = "http://xxx.cn/Course/TeachingCourse/PsychStats/"

# 循环从1开始,直到找不到PDF文件
i = 1
while True:
    # 构建完整的PDF文件名
    pdf_filename = f"{i}.pdf"

    # 构建完整的PDF URL
    pdf_url = url + pdf_filename

    # 发送HTTP请求
    response = requests.get(pdf_url)

    # 如果请求成功,保存PDF文件
    if response.status_code == 200:
        with open(pdf_filename, "wb") as f:
            f.write(response.content)
        print(f"已保存 {pdf_filename}")
    else:
        # 如果请求失败,停止循环
        break

    # 增加文件名计数器
    i += 1

保存成功:

相关推荐
测试员周周1 分钟前
【AI测试系统】第5篇:从 Archon 看 AI 工程化落地:为什么"确定性编排+AI 弹性智能"是终局?
人工智能·python·测试
大飞记Python41 分钟前
【2026更新】Python基础学习指南(AI版)——04数据类型
开发语言·人工智能·python
Hello eveybody2 小时前
介绍一下背包DP(Python)
开发语言·python·动态规划·dp·背包dp
2301_795099742 小时前
让 CSS Grid 自适应容器尺寸的动态布局方案
jvm·数据库·python
呆萌的代Ma2 小时前
python读取并加载.env的配置文件
python
Muyuan19982 小时前
27.RAG 系统中的上下文充分性判断:从 Chunk 数量、FAISS 距离到 LLM Relevance Gate
python·django·pdf·fastapi·faiss
U盘失踪了3 小时前
python curl转python脚本
开发语言·chrome·python
FQNmxDG4S3 小时前
Java泛型编程:类型擦除与泛型方法的应用场景
java·开发语言·python
bzmK1DTbd3 小时前
JDBC编程规范:PreparedStatement与事务管理
数据库·python·eclipse
我星期八休息3 小时前
IT疑难杂症诊疗室:AI时代工程师Superpowers进化论
linux·开发语言·数据结构·人工智能·python·散列表