一、环境准备
-
操作系统:Windows 10 或以上
-
Python版本:3.6及以上(示例用的是
D:\python\python.exe
) -
依赖库:
requests
,beautifulsoup4
,lxml
安装命令:bashpip install requests beautifulsoup4 lxml
- Python脚本路径示例:
Y:\0 数据汇总\农业干旱监测日报\download_drought.py
二、Python脚本示例
pythonimport requests from bs4 import BeautifulSoup from urllib.parse import urljoin from datetime import datetime import os URL = "https://www.nmc.cn/publish/agro/disastersmonitoring/Agricultural_Drought_Monitoring.htm" SAVE_DIR = r"Y:\0 数据汇总\农业干旱监测日报" os.makedirs(SAVE_DIR, exist_ok=True) def download_image(): headers = {"User-Agent": "Mozilla/5.0"} try: r = requests.get(URL, headers=headers, timeout=10) r.raise_for_status() soup = BeautifulSoup(r.content, "lxml") # 精确定位图片标签 img_tag = soup.select_one("div:nth-of-type(1) > div:nth-of-type(2) > img") if not img_tag: print("未找到图片") return img_url = urljoin(URL, img_tag['src']) print("图片URL:", img_url) timestamp = datetime.now().strftime("%Y%m%d_%H%M%S") file_name = f"drought_monitor_{timestamp}.jpg" save_path = os.path.join(SAVE_DIR, file_name) img_data = requests.get(img_url, headers=headers).content with open(save_path, "wb") as f: f.write(img_data) print(f"保存成功:{save_path}") except Exception as e: print("下载失败:", e) if __name__ == "__main__": download_image()
三、用任务计划程序定时运行Python脚本
1. 编写批处理文件(可选)
创建一个批处理文件
run_download.bat
,内容:batD:\python\python.exe "Y:\0 数据汇总\农业干旱监测日报\download_drought.py" pause
D:\python\python.exe
替换为你的Python解释器路径- 也可以直接任务计划里调用python执行脚本,不必须用批处理
2. 打开任务计划程序
- 按
Win
键,输入"任务计划程序",点击打开
3. 创建基本任务
- 右侧点击"创建基本任务..."
- 输入任务名称,例如"每日农业干旱监测图片下载",点击"下一步"
4. 触发器设置
- 选择触发时间:每天 / 每周 / 开机时 等,根据需要选择
- 设置具体时间,例如每天08:00,点击"下一步"
5. 操作设置
-
选择"启动程序",点击"下一步"
-
程序或脚本:
如果用批处理,填写批处理文件完整路径,如:
Y:\0 数据汇总\农业干旱监测日报\run_download.bat
如果直接调用Python:
D:\python\python.exe
-
添加参数(可选,如果直接调用Python执行脚本,这里填写Python脚本路径):
"Y:\0 数据汇总\农业干旱监测日报\download_drought.py"
-
起始位置(可选)填写Python脚本所在目录:
Y:\0 数据汇总\农业干旱监测日报
-
点击"下一步"
6. 完成任务创建
- 查看设置确认无误,点击"完成"
7. 测试任务
- 在任务计划程序库找到刚建的任务
- 右键点击 → "运行"
- 查看任务运行情况,确认图片已下载至指定目录
四、注意事项
- 路径中包含空格或中文时,尽量使用双引号括起来
- 确保Python解释器路径正确,且Python环境已安装依赖库
- 任务执行用户应有访问文件夹权限
- 若遇权限问题,任务属性中"使用最高权限运行"可尝试勾选
这样,你就可以通过Windows任务计划程序,实现定时自动运行Python爬虫脚本,自动下载目标图片并保存。
如果需要,我可以帮你写批处理脚本或远程调试具体问题。
- Python脚本路径示例: