论文阅读(十二月第四周)

标题

A Physics-informed deep neural network for the joint prediction of 3D chlorophyll-a and hydrographic fields in the Mediterranean Sea

背景

作者

Michela Sammartino,Lorenzo Della Cioppa, Simone Colella,Bruno Buongiorno Nardelli

期刊来源

Elsevier期刊

DOI

10.1016/J.ENVSOFT.2025.106660

摘要

监测海洋的四维状态对于海洋生态系统的保护至关重要。人工智能算法代表了合并卫星和现场测量的有前途的工具,可以改善海洋内部动态的重建。在这里,我们描述了4DMED-bionet。这是一个基于人工智能的模型,由欧洲航天局4DMED-Sea项目开发,旨在从地表观测推断地下属性。该模型结合卷积神经网络和长短期记忆层,重建了地中海温度、盐度、密度和叶绿素-a的4D

场。该算法包括一个物理信息损失函数,该函数对密度预测施加了约束,在不降低其他输出的情况下提高了其准确性。4DMED-bionet优于不同的深度学习模型。对4D数据的科学分析正在进行中,旨在更好地理解浮游植物响应与3D物理动态耦合的过程。

研究区域以及数据来源

现场数据:海洋学巡航数据库。生物地球化学- argo数据库。

数据分配地点如下图。

卫星数据:卫星叶绿素L4数据集。卫星海面温度L4数据集。卫星绝对动态地形L4数据集。

算法

在使用min/max归一化馈送网络之前,所有的剖面都在0-1区间内进行缩放:

​​​​​​​ ​​​​​​​ ​​​​​​​

4DMED-生物网

该算法包含以下参数作为输入变量:年份的日期(cos/sin 变换)、纬度、经度、SST、SSS、SSD、CHL、ADT、U*++g作系统++* 以及 V*++g作系统++*。

使用"mse"损耗函数训练了不同的网络配置,并在参考测试数据集上进行了测试。测试考虑了一个包含两层1000个节点的前馈神经网络(FFNN);一个包含35个隐藏单元的两层叠加长短期记忆网络(LSTM)、一个与LSTM配置相同的双向长短期记忆网络(Bi-LSTM),以及一个混合LSTM网络的一维卷积层(Conv1D + LSTM + Conv1D)。

不同架构的比较基于归一化均方根误差(NRMSE),该误差对四个生物物理变量的范围进行了归一化,同时也基于RMSE分布随深度变化的评估。(不同模型架构验证结果的比较:FFNN、Bi-LSTM、LSTM和Conv1D + LSTM + Conv1D。)

架构首先使用一维卷积层(Conv1D),随后是两层叠加的长短期记忆(LSTM)层(加上中撤层),然后是Conv1D层和稠密层(时间分布层)。

它由线性作组成,将输入的滑动部分逐元素乘以名为卷积滤波器的矩阵,并将元素相加以以输出每个深度层级(N)。该作给出唯一值,创建特征数组,汇总前一层输入检测到特征的存在情况。

​​​​​​​

其中n = 1 ...,N,N 是深度层级长度;M 是输入特征的数量,且𝑐输出滤波器的数量(此处为30个)和K是卷积核的长度。该x[𝑛,𝑚]表示特定深度层的输入变量,而W𝑚,𝑘,𝑐以及𝑏𝑐分别参考权重和偏差。

Conv1D 的输出随后传递给第一个 LSTM 层。LSTM 是一种循环神经网络,特别适合建模有序数据序列。

损失函数如下所示。

最终损失函数如下所示。

结果分析

对于物理变量(T和S),最高的RMSE值在20至60米深度之间观测到,对应上层混合层的底部,该区域在准确预测方面存在较大挑战。上层混合层是海洋的上边界层。其深度受空气-海洋相互作用调节,控制大气与海洋之间的热量、盐分和动量通量。该层以由小尺度湍流驱动的强烈混合为特征。混合层底部下方存在过渡层,特征为密度、温度和盐度的强烈垂直梯度。这些变量的相应剧变分别识别出所谓的耐层、温跃层和盐跃层。在这些层内,环境强迫的微小变化(如风混合、太阳辐射、内波)可能导致物理和生物地球化学性质的巨大且非线性响应。

对于叶绿素,最大误差范围更深,达到80米。事实上,这一深度范围通常对应于混合层深度以下的区域,该区域常观察到地下叶绿素最大值,表现出较高的季节性变异。不同的环境条件会影响SCM沿水柱的位置:尤其是光照和养分的可用性。这些环境因素使SCM在地中海不同区域的深度和大小上变化,遵循流域已有充分记录的西向东营养梯度。​​​​​​​证明了叶绿素轮廓的形状会因所考虑盆地的不同区域而有显著差异。在通常被归类为温带系统的西北地中海(NW-Med),从5月底到11月中旬,在约40--60米深处可以观察到强烈的叶绿素峰值。相比之下,黎凡特盆地更像一个热带系统,SCMs通常分布在更深处(80--95米)。

在展示使用混合Conv1D + LSTM架构而非简单堆叠LSTM时性能提升后,还研究了4DMED-生物网训练中包含这两个物理约束的影响。展示了两种不同情况下获得的密度RMSE:1)排除物理约束的运行(蓝线)与2)物理知情运行(红线)。虽然RMSE在温度、盐度和叶绿素方面差异较小,但当包含所有物理约束时,密度预测的准确性有所提升。因此,实现物理知情损失函数减少了密度误差,同时不影响其他变量。

重建后的四维场分布在规则网格上,横向空间分辨率为经纬度均为1/24°,设有148个垂直层级,深度从3米到150米,间隔1米,时间分辨率为1天。空间范围从6°W延伸至36°E,时间覆盖范围自1月1日开始2016年至8月1日, 2022。如下重建后的4D生物物理变量。

相关推荐
智算菩萨1 天前
【How Far Are We From AGI】3 AGI的边界扩张——数字、物理与智能三重接口的技术实现与伦理困境
论文阅读·人工智能·深度学习·ai·agi
智算菩萨1 天前
【How Far Are We From AGI】6 AGI的进化论——从胚胎到终极的三级跃迁与发展路线图
论文阅读·人工智能·深度学习·ai·agi
智算菩萨1 天前
【How Far Are We From AGI】7 AGI的七重奏——从实验室到现实世界的应用图景与文明展望
论文阅读·人工智能·ai·agi·感知
智算菩萨1 天前
多目标超启发式算法系统文献综述:人机协同大语言模型方法论深度精读
论文阅读·人工智能·深度学习·ai·多目标·综述
智算菩萨1 天前
【How Far Are We From AGI】5 AGI的“道德罗盘“——价值对齐的技术路径与伦理边界
论文阅读·人工智能·深度学习·ai·接口·agi·对齐技术
wuxuand1 天前
2026年时序分类综述论文阅读
论文阅读
StfinnWu1 天前
论文阅读《GridDehazeNet: Attention-Based Multi-Scale Network for Image Dehazing》
论文阅读·深度学习·机器学习
智算菩萨1 天前
AGI神话:人工通用智能的幻象如何扭曲与分散数字治理的注意力
论文阅读·人工智能·深度学习·ai·agi
红茶川1 天前
[论文阅读] π0: A Vision-Language-Action Flow Model for General Robot Control
论文阅读·ai·具身智能·vla
Matrix_111 天前
论文阅读:UltraFusion Ultra High Dynamic Imaging using Exposure Fusion
论文阅读·人工智能·计算摄影