【AIGC核心技术剖析】基于大规模弱监督的鲁棒语音识别【附源码】

论文研究了语音处理系统的能力,该系统只是为了预测互联网上的大量音频成绩单而训练的。当扩展到 680,000 小时的多语言和多任务监督时,生成的模型可以很好地推广到标准基准,并且通常与先前的完全监督结果竞争,但在零镜头传输设置中无需任何微调。与人类相比,这些模型接近其准确性和稳健性。论文正在发布模型和推理代码,作为进一步研究健壮语音处理的基础。



🧬code: https://github.com/mistralai/mistral-src

🦒colab: please try it 🐣 https://github.com/camenduru/Mistral-colab

🔥 Please join our discord server https://discord.gg/k5BwmmvJJU

🥳 Please join my patreon community https://patreon.com/camenduru

相关推荐
Mintopia5 小时前
🧠 AIGC模型的增量训练技术:Web应用如何低成本迭代能力?
前端·javascript·aigc
桂花饼7 小时前
Sora 2:当AI视频“以假乱真”,内容创作进入新纪元,体验AI创作能力
人工智能·aigc·多模态学习·ai视频生成·sora 2·视频生成api
墨风如雪20 小时前
不止能聊,还能“动手”:谷歌AI代理掀起数字浪潮
aigc
三天哥1 天前
演示和解读ChatGPT App SDK,以后Android/iOS App不用开发了?
人工智能·ai·chatgpt·aigc·openai·智能体·appsdk
算家计算1 天前
Wan2.2-Animate-14B 使用指南:从图片到动画的完整教程
人工智能·开源·aigc
Java中文社群1 天前
n8n和在线免费体验蚂蚁万亿开源大模型Ling-1T!
aigc·ai编程
用户5191495848451 天前
如何通过内核版本检查判断FreeBSD是否需要重启
人工智能·aigc
尘叶心简1 天前
LangGraph实现自适应RAGAgent
aigc·openai
FogLetter1 天前
从「关键词匹配」到「语义理解」:我是如何用 Embedding 让搜索「听懂人话」的?
前端·aigc·openai
FogLetter1 天前
从“满嘴跑火车”到“有据可依”:给大模型配个“外部硬盘”RAG
aigc·openai