【AIGC核心技术剖析】基于大规模弱监督的鲁棒语音识别【附源码】

论文研究了语音处理系统的能力,该系统只是为了预测互联网上的大量音频成绩单而训练的。当扩展到 680,000 小时的多语言和多任务监督时,生成的模型可以很好地推广到标准基准,并且通常与先前的完全监督结果竞争,但在零镜头传输设置中无需任何微调。与人类相比,这些模型接近其准确性和稳健性。论文正在发布模型和推理代码,作为进一步研究健壮语音处理的基础。



🧬code: https://github.com/mistralai/mistral-src

🦒colab: please try it 🐣 https://github.com/camenduru/Mistral-colab

🔥 Please join our discord server https://discord.gg/k5BwmmvJJU

🥳 Please join my patreon community https://patreon.com/camenduru

相关推荐
LeeZhao@4 小时前
【狂飙AGI】第4课:前沿技术-具身智能
语言模型·自然语言处理·aigc·embedding·agi
FogLetter5 小时前
智能前端中的语音交互:React音频播放与高级前端技术全解析
前端·react.js·aigc
后端小肥肠9 小时前
Coze智能体实战:3分钟构建专属数字人!公众号文章一键转为数字人口播视频(附喂饭级教程)
人工智能·aigc·coze
键盘歌唱家10 小时前
AIGC方案-java实现视频伪动效果
java·aigc·音视频
墨风如雪19 小时前
告别低效!Claude Code:你的代码库来了个“全能管家”
aigc
一只爱撸猫的程序猿19 小时前
创建一个基于Spring AI的智能旅行简单案例
spring boot·程序员·aigc
拖拖7651 天前
让大模型真正”思考”:Reinforcement Pre-Training(RPT)论文解读与实践
人工智能·aigc
redreamSo1 天前
AI Daily | AI日报:2025中国AI算力大会6月将举办; 程鹏:大模型重塑人才选拔方式; 李飞飞:空间智能是AI核心组件
程序员·aigc·资讯
墨风如雪2 天前
告别“死记硬背”:Meta V-JEPA 2,让AI拥有“物理直觉”!
aigc
火车叼位2 天前
MidJourney 零基础通关:一篇文章教会你全部要点
aigc