基于 CNN+LSTM 的全国年度降水预测实践

基于 CNN+LSTM 的全国年度降水预测实践

在气象预测中,长期降水预测一直是核心问题。除了传统 ConvLSTM,本项目尝试使用 CNN+LSTM 方法,对全国年度降水栅格进行预测(2025--2027 年),并严格保证预测在研究区内。


1. 项目背景

  • 输入数据:2000--2024 年全国降水年度栅格(每张 TIFF 一年)
  • 预测目标:2025--2027 年未来三年降水
  • 研究要求
    1. 预测严格限制在研究区
    2. 第一年的预测值合理,不受 nodata 或边缘干扰

CNN+LSTM 架构能同时处理栅格的空间信息(CNN 提取空间特征)和时间依赖(LSTM 处理年度序列),适合年度降水预测。


2. 数据处理

  1. 读取 TIFF 栅格

    • 每个像素表示全年降水
    • nodata 或无效像素用 0 或邻近平均填充
    • 生成研究区 mask
  2. 归一化

    • 仅对研究区有效像素计算均值和标准差
    • 保证模型输入不受无效区域影响
  3. 空间特征提取

    • 使用 CNN 对每张年度栅格提取低维特征向量
    • 特征向量作为 LSTM 输入序列
  4. 训练/验证划分

    • 训练集:2000--2020
    • 验证集:2021--2024
    • 输出预测 2025--2027

3. 模型架构

(1) CNN Encoder

  • 输入:年度栅格 [H, W]
  • 输出:低维空间特征 [C]
  • 结构:
    • 3 层卷积 + ReLU + BatchNorm
    • 全局平均池化输出向量

(2) LSTM 时间建模

  • 输入序列长度:INPUT_STEPS
  • 每步输入:CNN 提取的特征向量
  • 输出:未来 OUTPUT_STEPS 年特征向量

(3) Decoder

  • 将 LSTM 输出向量通过反卷积或全连接还原为栅格 [H, W]
  • 预测结果仅在研究区 mask 内有效,区域外填 nodata

(4) 损失函数

python 复制代码
MaskedHybridLoss = 0.7*MSE + 0.3*MAE  # 对降水极值加权
  • 可选加入 SSIM / 梯度损失增强空间结构

4. 训练策略

  • 优化器:AdamW + CosineAnnealingLR

  • 训练轮次:50--100 epoch

  • 批量大小:根据显存调整

  • 验证集监控:训练损失 vs 验证损失

  • GPU 管理

    • 训练结束 torch.cuda.empty_cache()
    • Windows 下 DataLoader 设置 num_workers=0

5. 预测流程

  1. 对最后 INPUT_STEPS 年数据提取 CNN 特征
  2. LSTM 预测未来 OUTPUT_STEPS 年特征
  3. Decoder 还原栅格
  4. patch 重建或整图预测
  5. 应用研究区 mask,输出 TIFF

6. 结果与经验

  1. 第一年预测值偏小

    • 原因:最后一年输入 nodata 多或均值偏低
    • 解决:使用有效区域均值填充 nodata
  2. 预测模糊

    • 原因:MSE 平滑 + patch 高斯融合

    • 解决:

      • 增大模型容量
      • 调整 patch 尺寸
      • 加入 SSIM / 边缘损失
  3. 研究区控制

    • 重建和输出均严格在研究区 mask 内
    • 确保 GIS 可直接使用

7. 技术栈

  • Python 3.11
  • PyTorch 2.5
  • Rasterio 1.4
  • Numpy、Scipy、TQDM
  • GPU 可选

8. 代码示意

python 复制代码
# CNN+LSTM 预测流程示意
features = []
for t in range(INPUT_STEPS):
    x = current_input[t] * valid_area_mask
    feat = cnn_encoder(x.unsqueeze(0).unsqueeze(0))
    features.append(feat)

features = torch.stack(features, dim=0)  # [T, C]
lstm_out = lstm(features.unsqueeze(1))  # [OUTPUT_STEPS, C]
preds = decoder(lstm_out)  # [OUTPUT_STEPS, H, W]
preds[:, ~valid_area_mask] = nodata_value
save_tiff(preds, output_folder)

9. 改进方向

  1. 多变量输入:温度、湿度、风场辅助特征
  2. 多分辨率 CNN 提升局地细节捕获
  3. Transformer 或 GAN 架构提高预测清晰度
  4. 数据增强:旋转、翻转、邻域插值

10. 总结

  • CNN+LSTM 可以有效建模年度栅格降水的空间和时间模式
  • 使用研究区 mask 确保预测区域正确
  • nodata 填充和 patch 重建优化保证第一年预测值合理
  • 可结合 SSIM / 边缘损失提升预测空间细节

关键词:CNN、LSTM、降水预测、年度栅格、研究区 mask、深度学习

相关推荐
荣码8 小时前
LangGraph多Agent协作:3个Agent干活比1个强,但我踩了4个坑
java·python
用户8356290780511 天前
Python 操作 PDF 附件:添加、查看与管理指南
后端·python
宇宙之一粟1 天前
乐企版式文件生成平台
java·后端·python
学测绘的小杨2 天前
CompassFusion:一个从 GNSS 到 GNSS/INS 组合导航的独立工程包
python
zzzzzz3102 天前
当产品经理说这个很简单:我用Python自动化处理奇葩需求的实战指南
python·pycharm·产品经理
雪隐2 天前
个人电脑玩AI-06让5060 Ti给你打工——不光能画画,Qwen3-TTS还能学人说话,连我老板都信了!
人工智能·后端·python
兵慌码乱3 天前
面向桌面端的资产管理系统分层架构设计与核心模块实现
python·系统架构·sqlite·pyqt5·数据库设计·桌面应用开发·mvc架构
hboot3 天前
AI工程师第三课 - 机器学习基础
python·scikit-learn·kaggle
顾林海3 天前
Agent入门阶段-编程基础-Python:流程控制
python·agent·ai编程
呱呱复呱呱3 天前
Django CBV 源码解读:一个请求是怎么找到你的 get() 方法的
python·django