【AIGC核心技术剖析】基于大规模弱监督的鲁棒语音识别【附源码】

论文研究了语音处理系统的能力,该系统只是为了预测互联网上的大量音频成绩单而训练的。当扩展到 680,000 小时的多语言和多任务监督时,生成的模型可以很好地推广到标准基准,并且通常与先前的完全监督结果竞争,但在零镜头传输设置中无需任何微调。与人类相比,这些模型接近其准确性和稳健性。论文正在发布模型和推理代码,作为进一步研究健壮语音处理的基础。



🧬code: https://github.com/mistralai/mistral-src

🦒colab: please try it 🐣 https://github.com/camenduru/Mistral-colab

🔥 Please join our discord server https://discord.gg/k5BwmmvJJU

🥳 Please join my patreon community https://patreon.com/camenduru

相关推荐
墨风如雪4 小时前
告别臃肿与慢速:小米ZipVoice如何重塑语音合成?
aigc
尘叶心简7 小时前
LangGraphAgent开发实战(二)
aigc·aiops
AI炼金师10 小时前
Claude Code vs Codex
aigc·ai编程
xiaohezi12 小时前
大模型效果总不好?别再靠“玄学”炼丹了!
aigc
安思派Anspire15 小时前
从 ETL 到 ELT 再到 EAI:AI 如何重塑数据处理
aigc·openai·agent
Mintopia16 小时前
AIGC驱动的Web界面设计:技术逻辑与用户体验平衡
前端·javascript·aigc
墨风如雪1 天前
MiniMax Music 1.5:AI 谱写新篇章,音乐创作告别Demo时代
aigc
袁庭新1 天前
职场人为什么必须学AI?
人工智能·aigc
Mintopia1 天前
长文本 AIGC:Web 端大篇幅内容生成的技术优化策略
前端·javascript·aigc