【AIGC核心技术剖析】基于大规模弱监督的鲁棒语音识别【附源码】

论文研究了语音处理系统的能力,该系统只是为了预测互联网上的大量音频成绩单而训练的。当扩展到 680,000 小时的多语言和多任务监督时,生成的模型可以很好地推广到标准基准,并且通常与先前的完全监督结果竞争,但在零镜头传输设置中无需任何微调。与人类相比,这些模型接近其准确性和稳健性。论文正在发布模型和推理代码,作为进一步研究健壮语音处理的基础。



🧬code: https://github.com/mistralai/mistral-src

🦒colab: please try it 🐣 https://github.com/camenduru/Mistral-colab

🔥 Please join our discord server https://discord.gg/k5BwmmvJJU

🥳 Please join my patreon community https://patreon.com/camenduru

相关推荐
桂花饼1 天前
Sora 2:从视频生成到世界模拟,OpenAI的“终极游戏”
人工智能·aigc·openai·sora 2
墨风如雪1 天前
大模型双雄逐鹿:深度思考与长程记忆的AI新篇章
aigc
多恩Stone1 天前
【3DV 进阶-5】3D生成中 Inductive Bias (归纳偏置)的技术路线图
人工智能·python·算法·3d·aigc
后端小肥肠1 天前
从 Coze 到 n8n:我用 n8n 实现了10w+小林漫画的爆款流水线生产
人工智能·aigc·agent
m0_650108241 天前
【论文精读】EMO:弱条件下基于 Audio2Video 扩散模型的表情肖像视频生成
aigc·扩散模型·论文精读·音频到视频生成·会说话的头部·弱条件
da_vinci_x1 天前
Substance Designer“程序化地形”与“Splat Map”生成管线
游戏·aigc·设计师·贴图·技术美术·游戏美术·substance designer
Mintopia2 天前
🤖 AIGC在Web教育场景中的自适应学习技术设计
前端·javascript·aigc
短视频矩阵源码定制2 天前
矩阵系统全面解析:构建智能营销体系的核心引擎
java·人工智能·矩阵·aigc·视频
墨风如雪2 天前
Kimi Linear:告别O(N²)!AI长文本的新一代“记忆大师”
aigc
陈果然DeepVersion2 天前
Java大厂面试真题:Spring Boot微服务+Kafka消息队列+AIGC场景实战问答全解析
spring boot·redis·微服务·kafka·消息队列·aigc·java面试