论文阅读（十二月第四周）

标题

A Physics-informed deep neural network for the joint prediction of 3D chlorophyll-a and hydrographic fields in the Mediterranean Sea

背景

作者

Michela Sammartino，Lorenzo Della Cioppa, Simone Colella,Bruno Buongiorno Nardelli

期刊来源

Elsevier期刊

DOI

10.1016/J.ENVSOFT.2025.106660

摘要

监测海洋的四维状态对于海洋生态系统的保护至关重要。人工智能算法代表了合并卫星和现场测量的有前途的工具，可以改善海洋内部动态的重建。在这里，我们描述了4DMED-bionet。这是一个基于人工智能的模型，由欧洲航天局4DMED-Sea项目开发，旨在从地表观测推断地下属性。该模型结合卷积神经网络和长短期记忆层，重建了地中海温度、盐度、密度和叶绿素-a的4D

场。该算法包括一个物理信息损失函数，该函数对密度预测施加了约束，在不降低其他输出的情况下提高了其准确性。4DMED-bionet优于不同的深度学习模型。对4D数据的科学分析正在进行中，旨在更好地理解浮游植物响应与3D物理动态耦合的过程。

研究区域以及数据来源

现场数据：海洋学巡航数据库。生物地球化学- argo数据库。

数据分配地点如下图。

卫星数据：卫星叶绿素L4数据集。卫星海面温度L4数据集。卫星绝对动态地形L4数据集。

算法

在使用min/max归一化馈送网络之前，所有的剖面都在0-1区间内进行缩放:

4DMED-生物网

该算法包含以下参数作为输入变量：年份的日期（cos/sin 变换）、纬度、经度、SST、SSS、SSD、CHL、ADT、U*++g作系统++* 以及 V*++g作系统++*。

使用"mse"损耗函数训练了不同的网络配置，并在参考测试数据集上进行了测试。测试考虑了一个包含两层1000个节点的前馈神经网络（FFNN）;一个包含35个隐藏单元的两层叠加长短期记忆网络（LSTM）、一个与LSTM配置相同的双向长短期记忆网络（Bi-LSTM），以及一个混合LSTM网络的一维卷积层（Conv1D + LSTM + Conv1D）。

不同架构的比较基于归一化均方根误差（NRMSE），该误差对四个生物物理变量的范围进行了归一化，同时也基于RMSE分布随深度变化的评估。（不同模型架构验证结果的比较：FFNN、Bi-LSTM、LSTM和Conv1D + LSTM + Conv1D。）

架构首先使用一维卷积层（Conv1D），随后是两层叠加的长短期记忆（LSTM）层（加上中撤层），然后是Conv1D层和稠密层（时间分布层）。

它由线性作组成，将输入的滑动部分逐元素乘以名为卷积滤波器的矩阵，并将元素相加以以输出每个深度层级（N）。该作给出唯一值，创建特征数组，汇总前一层输入检测到特征的存在情况。

其中n = 1 ...，N，N 是深度层级长度;M 是输入特征的数量，且𝑐输出滤波器的数量（此处为30个）和K是卷积核的长度。该x $𝑛,𝑚$ 表示特定深度层的输入变量，而W𝑚,𝑘,𝑐以及𝑏𝑐分别参考权重和偏差。

Conv1D 的输出随后传递给第一个 LSTM 层。LSTM 是一种循环神经网络，特别适合建模有序数据序列。

损失函数如下所示。

最终损失函数如下所示。

结果分析

对于物理变量（T和S），最高的RMSE值在20至60米深度之间观测到，对应上层混合层的底部，该区域在准确预测方面存在较大挑战。上层混合层是海洋的上边界层。其深度受空气-海洋相互作用调节，控制大气与海洋之间的热量、盐分和动量通量。该层以由小尺度湍流驱动的强烈混合为特征。混合层底部下方存在过渡层，特征为密度、温度和盐度的强烈垂直梯度。这些变量的相应剧变分别识别出所谓的耐层、温跃层和盐跃层。在这些层内，环境强迫的微小变化（如风混合、太阳辐射、内波）可能导致物理和生物地球化学性质的巨大且非线性响应。

对于叶绿素，最大误差范围更深，达到80米。事实上，这一深度范围通常对应于混合层深度以下的区域，该区域常观察到地下叶绿素最大值，表现出较高的季节性变异。不同的环境条件会影响SCM沿水柱的位置：尤其是光照和养分的可用性。这些环境因素使SCM在地中海不同区域的深度和大小上变化，遵循流域已有充分记录的西向东营养梯度。证明了叶绿素轮廓的形状会因所考虑盆地的不同区域而有显著差异。在通常被归类为温带系统的西北地中海（NW-Med），从5月底到11月中旬，在约40--60米深处可以观察到强烈的叶绿素峰值。相比之下，黎凡特盆地更像一个热带系统，SCMs通常分布在更深处（80--95米）。

在展示使用混合Conv1D + LSTM架构而非简单堆叠LSTM时性能提升后，还研究了4DMED-生物网训练中包含这两个物理约束的影响。展示了两种不同情况下获得的密度RMSE：1）排除物理约束的运行（蓝线）与2）物理知情运行（红线）。虽然RMSE在温度、盐度和叶绿素方面差异较小，但当包含所有物理约束时，密度预测的准确性有所提升。因此，实现物理知情损失函数减少了密度误差，同时不影响其他变量。

重建后的四维场分布在规则网格上，横向空间分辨率为经纬度均为1/24°，设有148个垂直层级，深度从3米到150米，间隔1米，时间分辨率为1天。空间范围从6°W延伸至36°E，时间覆盖范围自1月1日开始2016年至8月1日, 2022。如下重建后的4D生物物理变量。