余震强度预测能力升级,Nature 刊文认证基于神经网络的模型性能优于传统模型

作者:李宝珠
编辑:李玮栋、xixi,三羊
地震的发生涉及诸多变量,「预测」存在挑战,但余震发生次数及强度的预测已取得重大进展。

2023 年 12 月 18 日 23 时 59 分,甘肃省临夏州积石山县发生 6.2 级地震,震源深度 10 公里,截至 19 日 06 时,当地就已经监测到了 275 次余震。无独有偶,日本石川县能登半岛于 2024 年 1 月 1 日下午发生 7.6 级地震,截至当地时间 2 日 6 时,地震烈度超 2 度的余震已发生 129 次。

(日本地震强度分级中的 2 表示:在建筑物中处于安静状态的人群中,很多都能感觉到摇晃。)

虽不似猝不及防的主震那般剧烈,但余震的威力也同样不可小觑。一方面是因为强震的余震震级往往也不小;另一方面,余震带来的二次破坏,可能会令原本已极为脆弱的建筑进一步被摧毁,致使更大面积的坍塌。

此外,频繁的余震可能导致山体结构不稳,如遇降水还可能造成山体滑坡、泥石流等次生地质灾害。然而,余震通常也是不可预测的,因为在震后短时间内,很难确定主震会如何远程触发其他区域的断裂带。

其实,人们从未停止探索如何实现地震预测,尤其是 AI、大数据等技术所展现出的数据处理与推理能力,提供了更加灵活的解题思路,也取得了喜人的进展。Nature 记者 Alexandra Witze 此前曾在 Nature 发布报道,介绍了机器学习模型在预测地震余震及其强度方面的潜力。

原文链接:

https://www.nature.com/articles/d41586-023-02934-6

神经网络加持下的预测模型创新

灾难往往发生在电光火石之间,且难以凭借人力与之抗衡,所以人们才更加迫切地想要预测地震何时发生,从而提前撤离危险区域。虽然明确具体时间、地点的地震预测尚且很难实现,但余震预测却在深度学习的加持下成为可能,这无疑也将在很大程度上帮助灾后避难,并减小伤亡。

就像大语言模型需要通过数百万的单词、语句、段落等进行训练一样,训练地震预测模型也需要大量过往的地震数据,以预测余震发生概率。但研究人员发现,想要通过罕见的大地震明确预测所需要的检测指标,在实践中并不容易。过去几年,地震学家利用机器学习,发现了过往地震记录中从未被发现过的小地震,从而丰富了现有数据,为第二轮机器学习分析提供了新的素材。

美国地质勘探局 (United States Geological Survey, USGS) 目前使用的预测模型,是根据过往地震的震级和发生地点来预测可能发生的地震。而目前有三篇论文均采用了基于神经网络的预测方法,更好的捕捉了地震发生的复杂规律。

**首先,**加州大学伯克利分校的地球物理学家 Kelian Dascher-Cousineau 及同事,在 2008 年至 2021 年间南加州发生的数千次地震数据中测试了他们的模型。在预测两周内滚动发生的地震次数方面,该模型优于标准模型。此外,该模型还能更好地捕捉到可能发生的地震震级范围,从而减少发生意外大地震的几率。

目前,业内广泛使用的地震演化模拟方法是 ETAS (epidemic-type aftershock sequence) 模型。

具体而言,该研究测试了主震的属性,以及背景(深度、板块边界类型等)和震源(辐射能量、震源尺寸等)如何影响余震的数量,并将神经点过程模型 (neural-temporal point processes) 引入到标准地震预报框架中。

来源:Kelian Dascher-Cousineau 的 GitHub 个人主页https://keliankaz.github.io/academic-profile/

**其次,**英国布里斯托尔大学应用统计学家 Samuel Stockman,也开发了基于神经点过程的模型,在对 2016-2017 年意大利中部的地震数据进行训练时表现良好,并且,当研究人员降低训练集中的地震震级时,该机器学习模型表现得更好。

该研究已经发表于 Earth's Future。研究表明,神经点过程对低震级数据的预测性能优于地震余震统计模型 ETAS (Epidemic-Type Aftershock Sequence),且训练速度快。

论文地址:
https://agupubs.onlinelibrary.wiley.com/doi/10.1029/2023EF003777

**最后,**以色列特拉维夫大学物理学家 Yohai Bar-Sinai 领导团队开发了基于 encoder-decoder 的模型 FERN (Forecasting Earthquake Rates with Neural networks),在对日本 30 年的地震数据进行测试时,该模型的表现也优于标准模型。

模型体系架构

如上图所示,模型输入由神经网络编码,生成构造状态的潜在表征,然后传递给解码器网络。其思路的优势在于,可以自然而然地纳入不同的数据源和模式,并通过特定数据源编码器添加到模型中。此外,同一编码状态可作为多个预测头(解码器)的输入,用于不同的预测任务。该研究已发表于 Nature。

论文地址:
https://www.nature.com/articles/s41598-023-38033-9

智能地动------AI 地震实时监测系统

人们对「防患于未然」的期盼是推动地震预警系统持续升级的巨大动力,但我们首先要明确的是,目前已经落地应用并且持续迭代的是地震预警系统,而非地震预测。

两者虽只是一字之差,但技术难度与实际效果却迥然不同。地震预警, 是指在地震发生以后,抢在地震波传播到设防区域前,提前几秒至数十秒向其发出警报,以告知人们采取应急措施,从而减少伤亡;**地震预测,**则是指对尚未发生、但有可能发生的地震事件进行预告。

图源:微博@衝鋒号角

从不同区域的地面构成到地震板块之间的相互作用类型,以及地震波通过地球传播的方式,地震的评估涉及诸多变量,人们需要全面理解所有因素才能做出准确的判断。所以,「预测」并非易事,但「预警」则不然。

带入模型的视角看待「地震预警」,首先需要保障地震数据的及时输入,其次是快速、准确地处理正在发生的地震数据,进而推断断层的破裂方向、速度等,最后再通过通信手段实时传送至受灾区域。这一过程堪比与死神赛跑,也仅能争取到数秒的逃生时间。有数据显示,当地震发生后,如果能够提前3秒接收到地震预警信息,伤亡就会减少 14%,如果能提前 10 秒,伤亡就会减少 39%。

目前,全球多地都部署了地震预警系统,但接收预警信息的时间大多在 3-10 分钟。日本 REIS 地震预警系统,可在收到地震波信号 5 秒钟后计算出地震位置和震级,约 2 分钟后估计出地震破裂的震源机制;美国国家地质勘探局的自动速报系统需要 3-5 分钟报出地震信息;我国则在 2021 年发布了世界首个人工智能地震「实时」监测系统------智能地动。

该系统由中国科学技术大学张捷教授团队与中国地震局合作研发,可以在 1 秒钟内获得地震三要素------时(发震时刻)、空(震源位置)、强(地震震级),并获得震源机制,即断层破裂方向、速度等信息,从而实现地震信息的实时、自动检测与发布。

究其原理,「智能地动」主要是基于深度学习能力,根据数据库中汇集的上百万个地震资料,结合地震学理论,快速处理正在发生的地震数据。

而更重要的是,在监测到地震数据后,如何第一时间发出预警信息。

在本次甘肃地震中,积石山县附近的西宁、成都等地均有用户收到了手机地震预警,时间在 120 秒---240 秒不等,不少网友都在感叹国产手机的强大,但其实功劳更应该归功于成都高新减灾研究所与中国地震局联合建设的中国地震预警网提供了预警信息。其中,预警网提前 12 秒向距震中 56 千米的临夏市发出预警,提前 29 秒向距震中 110 千米的兰州市发出预警。

据成都高新减灾研究所所长王暾介绍,地震预警技术的原理是电磁波的传播远快于地震波,在地震横波到达预警目标区域之前,利用传播速度更快的电磁波向可能受影响地区发出预警。目前,华为、小米等国产手机均已接入中国地震预警网的地震预警功能,这次也是中国地震预警网第 80 次预警破坏性地震。

人类在自然灾害面前何其渺小,但随着 AI、大数据、物联网等技术的持续升级,我们也在用科技武装自己、日益强大起来。伴随新兴技术的加速迭代,人们也将不断优化地震预警系统,并向着「预测地震」的目标努力!

相关推荐
GIOTTO情27 分钟前
媒介宣发的技术革命:Infoseek如何用AI重构企业传播全链路
大数据·人工智能·重构
阿里云大数据AI技术35 分钟前
云栖实录 | 从多模态数据到 Physical AI,PAI 助力客户快速启动 Physical AI 实践
人工智能
小关会打代码43 分钟前
计算机视觉进阶教学之颜色识别
人工智能·计算机视觉
IT小哥哥呀1 小时前
基于深度学习的数字图像分类实验与分析
人工智能·深度学习·分类
机器之心1 小时前
VAE时代终结?谢赛宁团队「RAE」登场,表征自编码器或成DiT训练新基石
人工智能·openai
机器之心1 小时前
Sutton判定「LLM是死胡同」后,新访谈揭示AI困境
人工智能·openai
大模型真好玩1 小时前
低代码Agent开发框架使用指南(四)—Coze大模型和插件参数配置最佳实践
人工智能·agent·coze
jerryinwuhan1 小时前
基于大语言模型(LLM)的城市时间、空间与情感交织分析:面向智能城市的情感动态预测与空间优化
人工智能·语言模型·自然语言处理
落雪财神意2 小时前
股指10月想法
大数据·人工智能·金融·区块链·期股
中杯可乐多加冰2 小时前
无代码开发实践|基于业务流能力快速开发市场监管系统,实现投诉处理快速响应
人工智能·低代码