python 爬取网站图片的小demo

python 复制代码
# demo.py
# 首先引入各个模块
import os
import requests
from bs4 import BeautifulSoup
from urllib.parse import urljoin

def download_static_resources(url, output_dir="downloads"):
    # 创建输出目录
    if not os.path.exists(output_dir):
        os.makedirs(output_dir)
    
    # 设置请求头,模拟浏览器访问
    headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.45 Safari/537.36"
    }
    
    try:
        # 发送请求获取网页内容
        response = requests.get(url, headers=headers)
        if response.status_code != 200:
            print("无法访问页面,请检查链接是否有效!")
            return
        
        # 使用 BeautifulSoup 解析 HTML 内容
        soup = BeautifulSoup(response.text, 'html.parser')
        
        # 查找所有图片标签
        img_tags = soup.find_all("img")
        print(f"找到 {len(img_tags)} 张图片")
        
        for img in img_tags:
            # 获取图片的 src 属性
            img_url = img.get("src") or img.get("data-src")  # 有些图片可能使用 data-src
            if not img_url:
                continue
            
            # 将相对路径转换为绝对路径
            img_url = urljoin(url, img_url)
            
            # 下载图片
            try:
                img_response = requests.get(img_url, headers=headers)
                if img_response.status_code == 200:
                    # 提取文件名
                    img_name = os.path.basename(img_url.split("?")[0])  # 去掉查询参数
                    img_path = os.path.join(output_dir, img_name)
                    
                    # 保存图片到本地
                    with open(img_path, "wb") as img_file:
                        img_file.write(img_response.content)
                    print(f"已下载:{img_name}")
                else:
                    print(f"无法下载图片:{img_url}")
            except Exception as e:
                print(f"下载图片时出错:{e}")
    
    except Exception as e:
        print("发生错误:", e)

# 测试代码
if __name__ == "__main__":
    print("欢迎使用网页图片下载器!")
    print("请输入要下载图片的网页地址,按回车确认。")
    target_url = input("网页地址:")
    print("开始下载...")
    download_static_resources(target_url)
    print("\n下载完成!按回车键退出...")
    input()

使用:先安装必要的库,

bash 复制代码
pip install requests beautifulsoup4

运行:

bash 复制代码
python "/demo.py"

我们可以使用 PyInstaller 来将这个 Python 脚本打包成 exe 文件。以下是具体步骤:

bash 复制代码
pip install pyinstaller
bash 复制代码
pyinstaller --onefile --icon=download.ico demo.py


- --onefile : 打包成单个exe文件
- --icon : 添加图标(可选,需要准备一个.ico文件)
相关推荐
Python测试之道21 分钟前
测试开发面试题:Python高级特性通俗讲解与实战解析
开发语言·python
我想吃余23 分钟前
【C++篇】揭秘STL vector:高效动态数组的深度解析(从使用到模拟实现)
开发语言·c++·笔记·学习·stl
明月看潮生1 小时前
青少年编程与数学 02-019 Rust 编程基础 15课题、错误处理
开发语言·青少年编程·rust·编程与数学
明月看潮生1 小时前
青少年编程与数学 02-019 Rust 编程基础 19课题、项目发布
开发语言·青少年编程·rust·编程与数学
yy鹈鹕灌顶2 小时前
LeetCode 字符串类题目解析与 Java 实现指南(深度优化版)
java·开发语言·算法·leetcode
这里是小悦同学呀!3 小时前
python学习day2
java·python·学习
阳光_你好4 小时前
简单介绍C++中线性代数运算库Eigen
开发语言·c++·线性代数
未来可期叶8 小时前
如何用Python批量解压ZIP文件?快速解决方案
python
张槊哲8 小时前
ROS2架构介绍
python·架构
风逸hhh8 小时前
python打卡day29@浙大疏锦行
开发语言·前端·python