口哨声、歌声、boing声和biotwang声:用AI识别鲸鱼叫声

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

谷歌推出了一款全新的鲸鱼生物声学模型,可以识别八个不同的鲸鱼物种,其中包括两种物种的多种叫声。这个模型还包含了最近被确认为布氏鲸发出的"Biotwang"声。为了保护生活在偏远环境中的动物,研究人员必须能够追踪它们,了解它们的种群动态。随着长期被动声学监测技术的发展,基于大量声景数据的自动物种识别工具已经成为保护与生态研究的关键。然而,尽管有像Google Perch这样的鸟类声音识别模型,开发能够同时分类多个鲸鱼物种叫声的模型仍然充满挑战。https://github.com/google-research/perch/tree/main/chirp

鲸鱼的声学范围极为广泛,蓝鲸的声音可以低至10赫兹,而齿鲸(如虎鲸)的声音可高达120千赫兹。此外,录音还会因地点和时间的不同而产生巨大变化,使得模型开发更加复杂。特别是一些神秘的鲸鱼种类,其叫声特征仍不为人知,这进一步加剧了识别难度。一个典型的例子是"Biotwang"声,这种声音最早在马里亚纳海沟被记录,带有金属质感,与典型的鲸鱼低沉叫声完全不同。最近,NOAA(美国国家海洋和大气管理局)的研究人员将其确定为布氏鲸独特的叫声。

如今,谷歌的鲸鱼生物声学模型已能够识别八个物种,并可以区分两种物种的多种叫声类型。这个模型帮助研究人员分析了超过20万小时的海洋录音,解锁了许多关于鲸鱼生态的新发现。目前,模型已通过Kaggle Models开放下载。

项目背景

谷歌的鲸鱼叫声分类项目始于2018年,当时与NOAA的太平洋群岛渔业科学中心合作,开发了一个检测座头鲸叫声的模型。该模型通过分析NOAA收集的18.7万小时音频数据,确认了座头鲸的时空分布模式,还发现了它们在Kingman Reef的新分布地点。后来,谷歌与加拿大渔业和海洋部(DFO)合作,开发了一个虎鲸检测模型,帮助DFO实时监测濒危的南部居民虎鲸种群。

新的鲸鱼生物声学模型

最新的多物种模型能够为八种鲸鱼提供分类分数,并可进一步区分其中两种物种的不同叫声类型,总共涵盖了12个分类。模型使用原始音频数据生成频谱图,将其分类为12种鲸鱼叫声或物种之一。由于鲸鱼栖息环境中可能包含大量背景噪音,模型还特别训练了大量负样本,确保它能够有效排除背景音干扰。

模型在测试集上的表现非常优异,尤其是对于小须鲸、北大西洋露脊鲸、北太平洋露脊鲸和布氏鲸的分类,表现尤为突出。

模型中的新标签

除了常见的鲸鱼叫声,模型还包括了一些较为独特的声音。例如,小须鲸发出的"boing"声最早在上世纪50年代的潜艇录音中被记录,直到2005年才被确认属于小须鲸。北太平洋露脊鲸则以其"枪声"叫声而闻名,这种声音独特于该物种的东部种群。布氏鲸的"Biotwang"声也经过NOAA研究人员的确认,进一步丰富了模型的分类能力。

新发现

布氏鲸虽然在全球都有目击报告,但人们对其种群结构和迁徙模式知之甚少。通过谷歌模型对西太平洋声景数据的分析,研究人员发现了布氏鲸的叫声在该区域的季节性变化,揭示了不同种群之间可能存在的差异。这一发现为了解该物种的生态提供了重要线索。

扩展到更多物种

尽管模型目前仅涵盖了约94种鲸类物种中的八种,但它的潜在应用范围远远不止于此。研究人员可以使用模型的预训练嵌入技术,快速识别和分类新的鲸鱼声音或物种,为鲸类研究和保护提供强有力的支持。

相关推荐
黎阳之光2 小时前
黎阳之光:以视频孪生+全域感知,助力低空经济破局突围
大数据·人工智能·算法·安全·数字孪生
吃一根烤肠2 小时前
CloudBase MCP 实战:用自然语言 30 分钟搭建智能待办事项
人工智能
汽车仪器仪表相关领域2 小时前
Kvaser Leaf Light HS v2 M12:5 针 M12 NMEA 2000 接口,海事与工业 CAN 总线测试的防水耐用之选
大数据·网络·人工智能·功能测试·安全性测试
xiaoxiang96092 小时前
Graphify从入门到精通:用知识图谱彻底改变AI编程效率
人工智能·知识图谱·ai编程
CeshirenTester2 小时前
航旅纵横APP故障18h后,各项功能才恢复正常
人工智能
_冷眸_2 小时前
Voyago:龙虾(OpenClaw)驱动的一站式旅行规划套件
人工智能·自然语言处理·aigc·agent·claude code
CM莫问2 小时前
详解机器学习中的马尔可夫链
人工智能·算法·机器学习·概率论·马尔可夫·马尔科夫
人工智能AI技术2 小时前
编码基础:ASCII、Unicode、UTF-8 区别与原理
人工智能
大龄程序员狗哥2 小时前
第17篇:词向量(Word2Vec)解析——让文字拥有数学灵魂(原理解析)
人工智能·自然语言处理·word2vec
ElfBoard2 小时前
飞凌精灵(ElfBoard)技术贴|如何在RK3506开发板上实现UART功能复用
大数据·linux·人工智能·驱动开发·单片机·嵌入式硬件·物联网