【AIGC核心技术剖析】基于大规模弱监督的鲁棒语音识别【附源码】

论文研究了语音处理系统的能力,该系统只是为了预测互联网上的大量音频成绩单而训练的。当扩展到 680,000 小时的多语言和多任务监督时,生成的模型可以很好地推广到标准基准,并且通常与先前的完全监督结果竞争,但在零镜头传输设置中无需任何微调。与人类相比,这些模型接近其准确性和稳健性。论文正在发布模型和推理代码,作为进一步研究健壮语音处理的基础。



🧬code: https://github.com/mistralai/mistral-src

🦒colab: please try it 🐣 https://github.com/camenduru/Mistral-colab

🔥 Please join our discord server https://discord.gg/k5BwmmvJJU

🥳 Please join my patreon community https://patreon.com/camenduru

相关推荐
灵感__idea4 小时前
《AI工程》:为什么需要RAG和智能体?
aigc·openai·ai编程
AlbertZein11 小时前
从“看图说话”到“动手干活”:看看国产多模态模型在生产场景下的真实表现
aigc·openai·ai编程
plainGeekDev11 小时前
别再说 Claude Code 上下文不够用了,是你没管好
aigc·ai编程
leeyi15 小时前
MCP 工具集成:外部工具变 Eino Tool
aigc·agent·mcp
Coffeeee16 小时前
Prompt要花心思写,与 AI 对话的七个技巧
人工智能·aigc·ai编程
刘棕霆17 小时前
27—AI Skill 测评如何避免确认偏误:盲测对比与解盲分析
aigc·ai编程·测试
深蓝AI17 小时前
从零搭建 MCP Server:用 Python 把任意数据源接入 Claude
aigc
老程序猿17 小时前
AI 的「狼来了」,该不该信?一次真正感受到「恶意提示词」的误报
aigc·ai编程
AI袋鼠帝19 小时前
开源「仓颉.Skill」2.0,你现在可以蒸馏任何视频!
开源·aigc