一月第一周周报（论文阅读）

标题

Leveraging Recurrent Neural Networks for Flood Prediction and Assessment

背景

作者

Elnaz Heidari , Vidya Samadi and Abdul A. Khan

期刊来源

MDPI

DOI

10.3390/HYDROLOGY12040090

摘要

人工智能和机器学习的最新进展加速了许多水文过程预测性能的提高。然而，由于其复杂性，洪水预测仍然是一项具有挑战性的任务。困扰这项任务的两个常见挑战是洪水的波动性和洪水发生属性的敏感性和复杂性。本研究探讨了递归神经网络-特别是Vanilla递归神经网络，长短期记忆和门控递归单元在洪水预测和评估中的应用。通过整合流域特定的水文和气象变量，RNN模型利用顺序数据处理来捕捉洪水的时间动态和季节性模式特征。这些模型被应用于不同的地形，包括USA南卡罗来纳州的山区流域，以检验它们的稳健性和适应性。为了确定用于山洪分析的重要水文事件，使用PearsonIII型分布进行了流量频率分析。基于此分析估计了1年和2年的回归期流量，并选择1年的回归期流量作为山洪事件识别的保守阈值，以确保有足够数量的训练实例。与国家水模型的比较基准显示，基于rnn的方法在捕获洪水事件的强度和时间方面有显著的增强，特别是对于山洪暴发。将预测流量与仪表记录的流量进行比较，发现GRU具有最佳性能，因为它达到了最高的平均NSE值，并且在不同流域表现出较低的变异性。与GRU相比，LSTM结果的一致性略差，但取得了令人满意的效果，证明了其在水文预报中的价值。相比之下，VRNN的变异性最高，NSE值最低。NWM模型落后于基于机器学习的模型。该研究强调了RNN模型在推进水文预测方面的有效性。

研究区域以及数据来源

研究区域包括位于南卡罗来纳州西北部和西部的四个不同的集水区，每个集水区都由其排水区域定义，并以美国地质调查局的流量计为终点。所有汇水区都位于山区，其中一个汇水区位于南卡罗来纳州格林维尔的城市化地区，为密集开发环境中的水文过程提供了一个视角。其余的集水区代表了更多的自然景观，包括皮埃蒙特东部的史蒂文斯溪，该州北部的十二英里溪，以及东北部的查图加河。

数据有：北美陆地数据同化系统第2版。美国地质调查局

算法

RNN算法（变体）

传统的神经网络将输入视为独立的单元，这对于许多任务来说通常是一个有缺陷的假设，例如，预测序列中的下一个单词得益于知道前面的单词，RNN考虑了输入的时间序列，使它们适合于涉及序列数据的任务。RNN利用循环机制对序列中的每个元素执行相同的操作，其中当前计算依赖于当前输入和先前计算的结果。在本研究中，我们结合了三种众所周知的RNN变体，包括普通RNN、LSTM和GRU。所提出的洪水预测RNN管道的完整工作流程。

LSTM

LSTM网络是一种特别适合从数据序列中学习的RNN。它们旨在捕获长期依赖关系并缓解梯度消失问题。在反向传播过程中，LSTM网络不会经历梯度消失或爆炸，而是允许错误通过无限层传播。这是通过使用记忆单元/单元实现的。

ft:时间步长t的遗忘门，控制之前的细胞状态Ct−1的保留。

xt:时间步长t的动态输入向量。

σ: sigmoid激活函数，输出0到1之间的值，用于对信息流进行门控。

tanh:用于计算候选细胞和隐藏状态的双曲正切激活函数。

it:时间步长t的输入门，它决定了添加到细胞状态的新信息的数量。

Wi, Wf, Wc, Wh:输入到栅极连接的权重矩阵

Ui, U f, Uc, Uh:隐藏状态到门连接的权重矩阵。

bi, b f, bc, bh:门的偏置向量

:时间步长t的候选细胞状态，表示可能添加到细胞状态的新信息。

Ct:细胞在时间步t时的状态，作为长期记忆。

Ct−1:之前的细胞状态

ht:在时间步长t时更新的隐藏状态和输出。

GRU

旨在解决传统rnn的一些缺点，比如梯度消失问题。GRU是LSTM网络的精简版，旨在更有效地处理顺序数据。他们通过使用门控机制来调节信息流来实现这一点，这简化了模型并减少了参数的数量，从而实现了更快的训练和更高的效率。

zt:时间步长t的更新门，它控制有多少之前的隐藏状态被保留，有多少新的候选隐藏状态被使用。

rt:时间步长t的重置门，它决定了在计算新的候选隐藏状态时，有多少之前的隐藏状态被遗忘。

:时间步长t处的候选隐藏状态，使用当前输入和重置门修改的前一个隐藏状态来计算。

ht:时间步长t处的隐藏状态，根据更新门将之前的隐藏状态和新的候选隐藏状态结合起来。

xt:时间步长t处的动态输入向量。

Wz, Wr, Wh:输入到门连接的权重矩阵。

Uz, Ur, Uh:隐藏状态到门连接的权重矩阵。

bz, br, bh:门的偏置向量。

σ: sigmoid激活函数，输出0到1之间的值，用于更新门和复位门。

tanh:双曲正切激活函数，用于计算候选隐藏状态。

NWM模型

NWM综合了气象输入、天气预报、雷达降水、土壤湿度、积雪和地表条件来模拟河流、土壤湿度和其他水文变量。它在连续的基础上运行，旨在提供短期、中期和长期预报，使其成为洪水预测、水资源管理和应急响应规划的宝贵工具。

在本研究中，NWM流量再分析数据被用作rnn结果的基准。通过比较RNN输出与NWM

数据，我们旨在评估数据驱动方法在捕获复杂水文现象方面的有效性，以及它们在特定场

景下优于传统基于物理模型的能力。

事件识别

为了识别用于山洪分析的重要水文事件，根据回归期流量确定阈值流量值。具体而言，使用采用Pearson III型分布的流量频率曲线计算了1年重现期流量和2年重现期流量。按照常规做法，阈值流量被保守地定义为河岸流量，通常由2年回收期流量近似。然而，本研究使用1年回复期流量作为阈值，以确保有足够数量的事件用于模型训练。因此，本研究将所得流量值作为山洪预警的阈值，确保了事件识别的鲁棒性和实用性标准。一旦事件被提取出来，基流值也通过识别每次降雨事件之前的最小流量来确定，这些被包括为RNN模型的附加变量，以解释系统的初始状态。

结果分析

超参调整：调整过程利用了验证集，使用均方根误差和纳什-苏特克利夫效率等指标对性能进行评估。我们对epoch的数量使用了早期停止技术来防止过拟合。提前停止是一种优化技术，被广泛用于在不影响模型精度的情况下减少过拟合。早停背后的主要思想是在模型开始过拟合之前停止训练。要理解它是如何工作的，重要的是要看看训练和验证误差是如何随着epoch的数量而变化的。通常情况下，训练误差会通过增加epoch数来呈指数级下降，直到收敛。然而，验证误差最初会随着epoch的增加而减少，但在某一点之后，它开始增加。这是训练必须完成的点，因为超过这个点，过拟合会降低性能。最终的超参数设置是基于验证精度和计算效率之间的最佳权衡来选择的。

模拟结果的统计分析记录：

GRU的总体平均NSE最高，为0.70，其次是LSTM，为0.65。NWM的总体平均NSE为0.34,VRNN表现不佳，平均NSE为- 0.12。GRU的变异性最低(标准差为0.17)，表明性能一致，而VRNN的变异性最高(标准差为0.75)，表明性能波动较大。这些发现突出了GRU和LSTM等先进机器学习模型在洪水预测任务中的优越性，优于传统的基于物理的NWM。结果还表明，VRNN需要进一步优化和模型结构更新，以提高其在水文建模中的可靠性和泛化性。

评估了各种机器学习模型(VRNN、LSTM和GRU)的性能，以及基于物理的NWM v3.0再分析数据，使用包括气象和水文数据在内的不同数据集进行多个流域的洪水预测。研究结果表明，LSTM和GRU模型在提供洪水特征的准确预测方面具有优势，包括水流形状、峰值速率和峰值时间。LSTM和GRU模型都持续优于NWM，表明它们具有提高洪水预测精度的潜力。气象特征的关键作用，如降水数据及其空间分布，在研究中是显而易见的。这些变量显著地提高了山区流域的洪水预测精度。