XMOS的多项音频技术创新将大模型与边缘AI应用密切联系形成生态化合

2025蛇年春节,DeepSeek大语言模型以超低的训练成本震撼全球,预示着大模型技术将以更快的脚步全面走进我们的工作和生活,同时也促进了能够连通各种大模型和应用场景的智能终端将加速演进。语音作为人类与机器最常用的互动沟通媒体,将在大模型和边缘智能并蒂薄发的时代成为可带来巨大便利和效率的媒体,智能语音处理技术也将成为支撑大模型和边缘智能的关键技术之一。

与此同时,智能物联网技术领导者暨匠心独到的软件定义SoC半导体科技企业XMOS在2025年国际消费电子展(CES 2025)上,展出了一系列由AI技术驱动的音频技术,包括全新空间音效、语音捕获与降噪、音视频多模态AI处理等多种创新智能音频技术与应用解决方案,吸引了众多专业参观者的关注和商讨进一步合作。

这些可以同时支撑大模型和边缘智能的音频方案不仅具有强大的功能和极高的性能,而且还进一步降低了成本和功耗,从而可以加速智能端侧设备的应用和大模型的普及。

作为一家在全球音频处理技术领域享有长期声誉的半导体公司,上述智能音频解决方案皆得益于由XMOS开发的在单一器件中集成了高性能AI、DSP、I/O和控制功能的xcore.ai系列多核控制器。这些高性能、低延迟和低功耗处理器可以根据客户的需求,快速形成软件定义系统级芯片(SoC)解决方案,其带来的全新开发和应用模式已在在音频、工业和汽车等领域已经得到广泛的验证。

同时XMOS及其全球合作伙伴在这些器件上开发了多样化的智能音频方案,将边缘AI加速、高性能处理、先进算法与音频和话音的媒体特性充分结合,把智能、完美、准确和低延时的音频及处理更广泛地引入我们的生活和工作。例如,XMOS的XCORE-VOICE平台通过了ZOOM和TEAMS极为严格的认证,从而将开发优质音频系统的时间大为缩短、成本大幅降低。

目前,XMOS的智能音频技术和方案已经被广泛应用于智能消费电子、智能家居、智能汽车和办公应用,不仅为各种终端和系统提供了高质量的音频和音效,而且作为无所不在的人机接口和新兴生产力工具帮助这些应用连入各种网络。为了吸引更多的合作伙伴,XMOS派出的资深技术与应用团队在CES2025上展示了以下几个方面的技术创新:

·在任何设备上都能提供 3d 沉浸式空间音频,而且可以更安全地聆听

在任何设备上都能提供即插即用、每个比特都精确、丰富的3D沉浸式音频体验,不仅可以支持设备间的传输,而且减少了一半的耳鼓压力并实现所有延迟超低。该技术与所有的操作系统和耳机都可无缝兼容,同时满足游戏对超低延迟的要求。

·人工智能驱动的语音捕获功能,可在各种极具挑战性的环境中实现用深度神经网络( DNN )来降噪

XMOS的AI加速技术通过先进的算法提供降噪功能,以实时方式智能化地去除背景噪声,从而确保在极具挑战性的环境中能够清晰地捕获音频。适用于专业和工业应用。

·适用于音频和视觉的多模态 ai 处理

XMOS的多模态AI模型处理可支持音频和计算机视觉应用,适用于最具挑战性的实时性、始终在线应用,同时保护个人数据和隐私。

·以太网音频技术及开发板

XMOS正在孵化以太网音频技术(Audio over Ethernet),我们与Crowd Supply合作推出了AES67以太网音频开发板,以发现下一波基于以太网的音频应用场景和案例。

·可提供高保真音频的首个真正可扩展的会议解决方案

XMOS扩展了其领先的、在全球备受推崇的语音会议设备产品组合,通过可扩展的设计增加了超宽带、企业级的语音质量,从而使制造商们能够经济有效地应对多个细分市场。

·适用于始终在线的、支持 ai 本地命令的语音捕获,同时具有保护隐私功能的自动语音识别( asr )技术

XMOS的语音处理器产品组合提供远场语音捕获能力,并支持离线AI本地命令的功能,以提供始终在线的体验,有效保护了用户的隐私。

·适用于各种音频应用领域的超低延迟、高带宽、每比特都完美的 DSP 处理

通过推出一个全新的DSP音频处理库和示例应用程序,XMOS正在扩大对高性能音频的支持。

XMOS首席执行官Mark Lippett表示:"从CES 2025开始,我们就感受到我们在边缘智能和先进音频等领域的创新,在今年及以后能够取得的巨大成功。在CES上我们与主要客户和潜在新合作伙伴举行了为期4天的密集会议,我们的演示套件展示了几项引起了广泛关注的尖端音频技术,例如空间音频、DSP调谐和人工智能降噪等演示引起了伙伴们极大的兴趣。"

XMOS的这些技术创新正在通过该公司在全球的研发与应用支持体系,以及合作伙伴网络向各行各业渗透。在中国,除了XMOS中国团队,XMOS还与飞腾云科技和晓龙国际等伙伴共同支持中国工程师开发创新的应用,飞腾云是获得授权的XMOS全球首家增值经销商(Value-Added Reseller,VAR)。XMOS及其伙伴正在为全球的品牌厂商(OEM)用户、运营商和渠道商等商业客户设计和制造新一代的音频产品。

展望未来,Mark补充道:"针对大模型等更先进的技术、更广泛的连接和更多元的应用场景,XMOS也在持续投入研发,例如我们在CES上也展示了以太网音频和超宽带(UWB)音频技术等早期探索,它们也引起了人们的兴趣并引发了热烈的讨论,XMOS和客户及伙伴也从讨论中看到了诸多机会。总体而言,CES 2025成功展示我们的最新开发成果,而大模型的加速发展正在证明我们的创新路线是非常正确的,我们期待着在今年及2026年用创新为生态伙伴及最终用户带来巨大的回报。"

相关推荐
Jurio.13 分钟前
【论文笔记】Are Self-Attentions Effective for Time Series Forecasting? (NeurIPS 2024)
论文阅读·人工智能·python·深度学习·自然语言处理·transformer
月光下的麦克28 分钟前
opencv交叉编译
人工智能·opencv·计算机视觉
APItesterCris37 分钟前
独立站赋能反向海淘:跨境代购系统的用户体验与支付解决方案
大数据·人工智能·ux
管大虾43 分钟前
设计模式-适配器模式
java·设计模式·适配器模式
rockmelodies1 小时前
DeepSeek神经网络:技术架构与实现原理探析
人工智能·神经网络·架构
赵钰老师1 小时前
【大语言模型】最新ChatGPT、DeepSeek等大语言模型助力高效办公、论文与项目撰写、数据分析、机器学习与深度学习建模等科研应用
人工智能·python·深度学习·机器学习·语言模型·chatgpt·数据分析
Shinka-深深1 小时前
《图解设计模式》笔记(八)管理状态
java·笔记·设计模式
FLZJ_KL1 小时前
【设计模式】【行为型模式】观察者模式(Observer)
java·观察者模式·设计模式
金士镧新材料有限公司1 小时前
稀土抑烟剂——为汽车火灾安全增添防线
人工智能·科技·安全·全文检索·生活
adaierya1 小时前
简化的动态稀疏视觉Transformer的PyTorch代码
人工智能·深度学习