问题描述 :python爬取pdf文件并保存至本地,目标网址下有一系列pdf 文件,其中"1.pdf "为想要保存的pdf文件,并且想要保存的pdf是多个pdf,pdf的文件名随着网址中的"1.pdf "变化而变化,规律是依次增加,比如"1.pdf "、"2.pdf "、"3.pdf "...,现在想要通过循环改变网址来保存这些pdf。
python
# -*- coding: utf-8 -*-
"""
@author: cattt3
"""
import requests
from bs4 import BeautifulSoup
# 目标网址
url = "http://xxx.cn/Course/TeachingCourse/PsychStats/"
# 循环从1开始,直到找不到PDF文件
i = 1
while True:
# 构建完整的PDF文件名
pdf_filename = f"{i}.pdf"
# 构建完整的PDF URL
pdf_url = url + pdf_filename
# 发送HTTP请求
response = requests.get(pdf_url)
# 如果请求成功,保存PDF文件
if response.status_code == 200:
with open(pdf_filename, "wb") as f:
f.write(response.content)
print(f"已保存 {pdf_filename}")
else:
# 如果请求失败,停止循环
break
# 增加文件名计数器
i += 1
保存成功:
