【AIGC核心技术剖析】基于大规模弱监督的鲁棒语音识别【附源码】

论文研究了语音处理系统的能力,该系统只是为了预测互联网上的大量音频成绩单而训练的。当扩展到 680,000 小时的多语言和多任务监督时,生成的模型可以很好地推广到标准基准,并且通常与先前的完全监督结果竞争,但在零镜头传输设置中无需任何微调。与人类相比,这些模型接近其准确性和稳健性。论文正在发布模型和推理代码,作为进一步研究健壮语音处理的基础。



🧬code: https://github.com/mistralai/mistral-src

🦒colab: please try it 🐣 https://github.com/camenduru/Mistral-colab

🔥 Please join our discord server https://discord.gg/k5BwmmvJJU

🥳 Please join my patreon community https://patreon.com/camenduru

相关推荐
苍何2 小时前
腾讯发布杀手级AI开发工具,可一键使用Claude Code(附一手使用教程)
aigc
CoolerWu3 小时前
MCP到底是什么?与MCP Client&MCP Server区别在哪?
aigc
用户5191495848454 小时前
curl --continue-at 参数异常行为分析:文件覆盖与删除风险
人工智能·aigc
用户5191495848454 小时前
初识ARIA时我希望有人告诉我的事:Web无障碍开发指南
人工智能·aigc
Mintopia4 小时前
React 牵手 Ollama:本地 AI 服务对接实战指南
前端·javascript·aigc
用户5191495848456 小时前
Three.js实例化技术:高效渲染数千3D对象
人工智能·aigc
AI山脚学长6 小时前
Chrome 插件自动保存,断网崩溃也不怕!99% 表单党不知道的救命神器!
aigc
cos7 小时前
FE Bits Vol.3|CSS attr() 类型化进化,PostCSS 复盘 12 年
前端·css·aigc
安思派Anspire7 小时前
测试18种RAG技术,找出最优方案(四)
aigc·openai·agent
堆栈future1 天前
LangGraph实践-构建AI工作流:创建一本大模型应用开发书籍
langchain·llm·aigc