# 自动定时运行Python爬虫脚本教程(Windows任务计划程序)

一、环境准备

  • 操作系统:Windows 10 或以上

  • Python版本:3.6及以上(示例用的是D:\python\python.exe

  • 依赖库:requests, beautifulsoup4, lxml
    安装命令:

    bash 复制代码
    pip install requests beautifulsoup4 lxml
    • Python脚本路径示例:
      Y:\0 数据汇总\农业干旱监测日报\download_drought.py

    二、Python脚本示例

    python 复制代码
    import requests
    from bs4 import BeautifulSoup
    from urllib.parse import urljoin
    from datetime import datetime
    import os
    
    URL = "https://www.nmc.cn/publish/agro/disastersmonitoring/Agricultural_Drought_Monitoring.htm"
    SAVE_DIR = r"Y:\0 数据汇总\农业干旱监测日报"
    os.makedirs(SAVE_DIR, exist_ok=True)
    
    def download_image():
        headers = {"User-Agent": "Mozilla/5.0"}
        try:
            r = requests.get(URL, headers=headers, timeout=10)
            r.raise_for_status()
            soup = BeautifulSoup(r.content, "lxml")
    
            # 精确定位图片标签
            img_tag = soup.select_one("div:nth-of-type(1) > div:nth-of-type(2) > img")
            if not img_tag:
                print("未找到图片")
                return
            img_url = urljoin(URL, img_tag['src'])
    
            print("图片URL:", img_url)
    
            timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
            file_name = f"drought_monitor_{timestamp}.jpg"
            save_path = os.path.join(SAVE_DIR, file_name)
    
            img_data = requests.get(img_url, headers=headers).content
            with open(save_path, "wb") as f:
                f.write(img_data)
            print(f"保存成功:{save_path}")
    
        except Exception as e:
            print("下载失败:", e)
    
    if __name__ == "__main__":
        download_image()

    三、用任务计划程序定时运行Python脚本

    1. 编写批处理文件(可选)

    创建一个批处理文件 run_download.bat,内容:

    bat 复制代码
    D:\python\python.exe "Y:\0 数据汇总\农业干旱监测日报\download_drought.py"
    pause
    • D:\python\python.exe 替换为你的Python解释器路径
    • 也可以直接任务计划里调用python执行脚本,不必须用批处理

    2. 打开任务计划程序

    • Win键,输入"任务计划程序",点击打开

    3. 创建基本任务

    • 右侧点击"创建基本任务..."
    • 输入任务名称,例如"每日农业干旱监测图片下载",点击"下一步"

    4. 触发器设置

    • 选择触发时间:每天 / 每周 / 开机时 等,根据需要选择
    • 设置具体时间,例如每天08:00,点击"下一步"

    5. 操作设置

    • 选择"启动程序",点击"下一步"

    • 程序或脚本:

      如果用批处理,填写批处理文件完整路径,如:

      复制代码
      Y:\0 数据汇总\农业干旱监测日报\run_download.bat

      如果直接调用Python:

      复制代码
      D:\python\python.exe
    • 添加参数(可选,如果直接调用Python执行脚本,这里填写Python脚本路径):

      复制代码
      "Y:\0 数据汇总\农业干旱监测日报\download_drought.py"
    • 起始位置(可选)填写Python脚本所在目录:

      复制代码
      Y:\0 数据汇总\农业干旱监测日报
    • 点击"下一步"


    6. 完成任务创建

    • 查看设置确认无误,点击"完成"

    7. 测试任务

    • 在任务计划程序库找到刚建的任务
    • 右键点击 → "运行"
    • 查看任务运行情况,确认图片已下载至指定目录

    四、注意事项

    • 路径中包含空格或中文时,尽量使用双引号括起来
    • 确保Python解释器路径正确,且Python环境已安装依赖库
    • 任务执行用户应有访问文件夹权限
    • 若遇权限问题,任务属性中"使用最高权限运行"可尝试勾选

    这样,你就可以通过Windows任务计划程序,实现定时自动运行Python爬虫脚本,自动下载目标图片并保存。


    如果需要,我可以帮你写批处理脚本或远程调试具体问题。

    复制代码
相关推荐
奔波霸的伶俐虫2 小时前
jeecg框架@Dict不生效问题
开发语言·python
程序员秘密基地3 小时前
基于html,css,jquery,django,lstm,cnn,tensorflow,bert,推荐算法,mysql数据库
python·cnn·tensorflow·lstm·推荐算法
技术炼丹人3 小时前
从RNN为什么长依赖遗忘到注意力机制的解决方案以及并行
人工智能·python·算法
Lovyk3 小时前
Linux 系统启动原理
linux·服务器·windows
hqxstudying4 小时前
Java开发时出现的问题---语言特性与基础机制陷阱
java·jvm·python
仪器科学与传感技术博士4 小时前
python:机器学习中的分类与回归怎么理解
python·机器学习·分类
CodeCraft Studio4 小时前
使用 Aspose.OCR 将图像文本转换为可编辑文本
java·人工智能·python·ocr·.net·aspose·ocr工具
allenXer4 小时前
Flask全栈入门:打造区块链艺术品交易所
python·flask·区块链
2202_756749695 小时前
06 基于sklearn的机械学习-欠拟合、过拟合、正则化、逻辑回归
人工智能·python·深度学习·机器学习·计算机视觉·逻辑回归·sklearn