AOMedia发布免版税沉浸音频规范IAMF

11月10日,开放媒体联盟(AOMedia)发布了旗下首个沉浸式音频规范IAMF(https://aomediacodec.github.io/iamf/),IAMF是一种编解码器无关的容器规范,可以携带回放时间渲染算法和音频混音的信息,而且和旗下的AV1视频标准一样为免版税。

从AV1开始,AOMedia就在用开放来对抗老牌的标准组织ITU与ISO/IEC的HEVC、VVC等标准。目前,AV1已经成为主流视频平台的主力标准,包括Netflix、Meta、苹果等都在持续扩大AV1的应用部署。同样,IAMF也自然成为对抗商业沉浸式音频方案的主力。目前,业界影响力最大的沉浸式音频解决方案是杜比(Dolby Atmos),苹果就采用了Dolby Atmos作为自身沉浸式音频的解决方案。考虑到杜比在多媒体生产与消费领域拥有全方位的渗透,苹果选择杜比是顺其自然的。此外,全景声科技也是沉浸式音频主要的解决方案商。

AV1的成功在于AOMedia把多媒体各个关键环节的企业拉到了一起,从内容生产侧的工具、内容IP所有者,分发渠道OTT,终端设备商、芯片和关键技术服务商。当然,AV1的成功也得益于HEVC混乱的版税机制的助攻。

根据三星发布的新闻稿显示,IAMF项目始于2020年,由三星和Google共同开发,并最终成为AOMedia发布。三星是AOMedia的创始成员。尽管苹果也是AOMedia创始成员,但在自己的生态中依然采用了更加成熟的Dolby Atmos作为沉浸式音频解决方案。AOMedia的成员中还包括Amazon、Meta、微软、Netflix、腾讯、oppo、Vimeo等内容平台方,这些平台的选择将很大程度决定IAMF的命运。

IAMF的关键亮点如下:

适用于所有设备的空间音频:IAMF可以将基于通道和基于场景的全景声空间音频演示无缝传送到包括耳机、移动电话、电视机、家庭影院和网络在内的各种设备上。这种多功能性确保在各个平台上提供一致的高质量音频体验。

灵活的音频传输:IAMF提供了一种灵活的方法,可以将不同类型的音频元素传输到终端设备上。无论是将3.1.2通道音频与立体声音频相结合,IAMF都可以实现。IAMF提供了一种信号渲染算法(例如EAR和BEAR)的方式,以便在扬声器布局和耳机中播放。

创作者友好:创作者可以使用现有的开源插件,如EAR Production Suite,开始创建符合IAMF规范的沉浸式音频内容,该插件包括多扬声器布局和双耳监控的渲染器。IAMF能够携带并包含多个音频混音配置,使创作者和用户能够根据不同的播放偏好进行可控的响度调整。在不久的将来,AOMedia开源参考软件将添加一种IAMF编码工具,用于将各种音频混音压缩为IAMF。

AI驱动:IAMF利用人工智能和深度学习技术来分析场景,并突出内容的某些方面,调整音频水平以增强整个观看体验中的声音效果。使用IAMF技术,用户将能够根据自己的喜好自由调整声音。无论观众想要增强动作场景的音效还是增强对话的清晰度,IAMF都为他们提供了自定义内容音频的灵活性,以实现更个性化的体验。

你可以在这里(https://github.com/AOMediaCodec)找到IAMF规范和参考软件解码器,以及完整的测试流。

据三星研究院视觉技术团队的WooHyun Nam透露,三星研究团队目前正在开发IAMF技术的高级版本,可应用于移动设备、元宇宙、视频游戏等领域。

参考信息:

https://aomedia.org/press releases/AOMedia-Advances-the-Audio-Innovation-Era/

https://news.samsung.com/global/interview-movie-quality-audio-from-the-comfort-of-your-home-meet-the-leaders-of-next-generation-3d-audio-technology

▼点击下方 阅读原文

进入LiveVideoStackCon 2023深圳站官网 了解更多精彩演讲

相关推荐
二等饼干~za8986686 小时前
豆包GEO优化源码开发全解析:技术架构、实现逻辑与实操指南
数据库·sql·重构·架构·mybatis·音视频
枳实-叶6 小时前
嵌入式音视频开发——视频码率与码率控制技术
音视频
小鹿软件办公7 小时前
Solong 音频转换器:免费批量提取视频中的音频文件
音视频·免费音频播放器
EasyCVR7 小时前
插件模块化集成设计:花屏蓝屏画面模糊检测...EasyCVR视频质量诊断功能的技术与落地逻辑
服务器·数据库·音视频·视频质量诊断
琪伦的工具库7 小时前
批量视频根据参数重命名工具使用指南
ffmpeg·音视频
琪伦的工具库8 小时前
批量视频分割软件使用指南
音视频
txp玩Linux8 小时前
嵌入式音视频:语音识别开源项目
人工智能·音视频·语音识别
沃普天科技8 小时前
IF8032芯片TYPE C全功能输出支持C口显示器,支持AR眼镜 显示,支持接扩展坞,支持PD100W 4K144
游戏·智能手机·计算机外设·电脑·ar·音视频·显示器
AI服务老曹8 小时前
企业级视频中台的协议兼容性架构:基于 GB28181 与 RTSP 的全品牌设备统一接入方案
架构·音视频