【AIGC核心技术剖析】基于大规模弱监督的鲁棒语音识别【附源码】

论文研究了语音处理系统的能力,该系统只是为了预测互联网上的大量音频成绩单而训练的。当扩展到 680,000 小时的多语言和多任务监督时,生成的模型可以很好地推广到标准基准,并且通常与先前的完全监督结果竞争,但在零镜头传输设置中无需任何微调。与人类相比,这些模型接近其准确性和稳健性。论文正在发布模型和推理代码,作为进一步研究健壮语音处理的基础。



🧬code: https://github.com/mistralai/mistral-src

🦒colab: please try it 🐣 https://github.com/camenduru/Mistral-colab

🔥 Please join our discord server https://discord.gg/k5BwmmvJJU

🥳 Please join my patreon community https://patreon.com/camenduru

相关推荐
柳杉4 小时前
从零打造 AI 全球趋势监测大屏
前端·javascript·aigc
饼干哥哥5 小时前
用Openclaw+Obsidian搭建内容工厂,写100W+阅读爆文,单篇6000元
aigc
DigitalOcean7 小时前
GPU对比:MI350X、MI325X、MI300X、H200、H100
llm·aigc
悦心墨客8 小时前
OpenClaw 实战:5 个核心 Skill 详解与提示词指南
aigc
用户8150916072608 小时前
2026最新OpenClaw(龙虾ai)安装配置API思路与推荐方案
aigc
奋斗的小鸟111111 小时前
文件格式转换新革命:智能编辑与高效工作流
aigc·openai·ai开发·访答
小碗细面12 小时前
Anthropic 官方指南:构建 Skills 的秘密都在这里
aigc·ai编程
冬奇Lab1 天前
OpenClaw 源码精读(3):Agent 执行引擎——AI 如何「思考」并与真实世界交互?
人工智能·aigc
量子位1 天前
全球首份大模型业绩报!MiniMax预判2026三大超级PMF,AI平台公司启程了
aigc·ai编程
量子位1 天前
这届MWC真成了中国AI主场,小米直接把AI从对话框里拽出来接管物理世界了
llm·aigc