AOMedia发布免版税沉浸音频规范IAMF

11月10日,开放媒体联盟(AOMedia)发布了旗下首个沉浸式音频规范IAMF(https://aomediacodec.github.io/iamf/),IAMF是一种编解码器无关的容器规范,可以携带回放时间渲染算法和音频混音的信息,而且和旗下的AV1视频标准一样为免版税。

从AV1开始,AOMedia就在用开放来对抗老牌的标准组织ITU与ISO/IEC的HEVC、VVC等标准。目前,AV1已经成为主流视频平台的主力标准,包括Netflix、Meta、苹果等都在持续扩大AV1的应用部署。同样,IAMF也自然成为对抗商业沉浸式音频方案的主力。目前,业界影响力最大的沉浸式音频解决方案是杜比(Dolby Atmos),苹果就采用了Dolby Atmos作为自身沉浸式音频的解决方案。考虑到杜比在多媒体生产与消费领域拥有全方位的渗透,苹果选择杜比是顺其自然的。此外,全景声科技也是沉浸式音频主要的解决方案商。

AV1的成功在于AOMedia把多媒体各个关键环节的企业拉到了一起,从内容生产侧的工具、内容IP所有者,分发渠道OTT,终端设备商、芯片和关键技术服务商。当然,AV1的成功也得益于HEVC混乱的版税机制的助攻。

根据三星发布的新闻稿显示,IAMF项目始于2020年,由三星和Google共同开发,并最终成为AOMedia发布。三星是AOMedia的创始成员。尽管苹果也是AOMedia创始成员,但在自己的生态中依然采用了更加成熟的Dolby Atmos作为沉浸式音频解决方案。AOMedia的成员中还包括Amazon、Meta、微软、Netflix、腾讯、oppo、Vimeo等内容平台方,这些平台的选择将很大程度决定IAMF的命运。

IAMF的关键亮点如下:

适用于所有设备的空间音频:IAMF可以将基于通道和基于场景的全景声空间音频演示无缝传送到包括耳机、移动电话、电视机、家庭影院和网络在内的各种设备上。这种多功能性确保在各个平台上提供一致的高质量音频体验。

灵活的音频传输:IAMF提供了一种灵活的方法,可以将不同类型的音频元素传输到终端设备上。无论是将3.1.2通道音频与立体声音频相结合,IAMF都可以实现。IAMF提供了一种信号渲染算法(例如EAR和BEAR)的方式,以便在扬声器布局和耳机中播放。

创作者友好:创作者可以使用现有的开源插件,如EAR Production Suite,开始创建符合IAMF规范的沉浸式音频内容,该插件包括多扬声器布局和双耳监控的渲染器。IAMF能够携带并包含多个音频混音配置,使创作者和用户能够根据不同的播放偏好进行可控的响度调整。在不久的将来,AOMedia开源参考软件将添加一种IAMF编码工具,用于将各种音频混音压缩为IAMF。

AI驱动:IAMF利用人工智能和深度学习技术来分析场景,并突出内容的某些方面,调整音频水平以增强整个观看体验中的声音效果。使用IAMF技术,用户将能够根据自己的喜好自由调整声音。无论观众想要增强动作场景的音效还是增强对话的清晰度,IAMF都为他们提供了自定义内容音频的灵活性,以实现更个性化的体验。

你可以在这里(https://github.com/AOMediaCodec)找到IAMF规范和参考软件解码器,以及完整的测试流。

据三星研究院视觉技术团队的WooHyun Nam透露,三星研究团队目前正在开发IAMF技术的高级版本,可应用于移动设备、元宇宙、视频游戏等领域。

参考信息:

https://aomedia.org/press releases/AOMedia-Advances-the-Audio-Innovation-Era/

https://news.samsung.com/global/interview-movie-quality-audio-from-the-comfort-of-your-home-meet-the-leaders-of-next-generation-3d-audio-technology

▼点击下方 阅读原文

进入LiveVideoStackCon 2023深圳站官网 了解更多精彩演讲

相关推荐
墨尊3 小时前
通过flv.js在网页中拉流进行视频播放
开发语言·javascript·音视频
加油搞钱加油搞钱3 小时前
鹰盾Win播放器作为专业的视频安全解决方案,除了硬件翻录外还有什么呢?
网络·安全·音视频·视频加密·鹰盾播放器·鹰盾加密器
嘟嘟实验室3 小时前
MatAnyone本地部署,视频分割处理,绿幕抠像(WIN/MAC)
windows·macos·开源·aigc·音视频
亿牛云爬虫专家10 小时前
小红书视频图文提取:采集+CV的实战手记
音视频·爬虫代理·短视频·代理ip·品牌营销·小红书·热点分析
摆渡搜不到你12 小时前
某腾X视频下载器2.1
python·音视频
小草cys16 小时前
使用 Coze 工作流一键生成抖音书单视频:全流程拆解与技术实现
人工智能·音视频·工作流·coze
Jack153027682791 天前
GC1808:高性能音频ADC的卓越之选
单片机·嵌入式硬件·音视频·医疗器械·电动工具·家电产品
想躺在地上晒成地瓜干1 天前
树莓派超全系列教程文档--(62)使用rpicam-app通过网络流式传输视频
linux·网络·音视频·树莓派·raspberrypi·树莓派教程
追随远方1 天前
Android高性能音频与图形开发:OpenSL ES与OpenGL ES最佳实践
android·elasticsearch·音视频
Sleepless_斑马1 天前
【FFmpeg学习(2)】视频概念
学习·ffmpeg·音视频