SenseVoice - 阿里最新开源精准多语言语音识别与情感辨识模型 本地一键整合包下载


阿里巴巴近期发布了开源语音大模型项目FunAudioLLM,该项目包含了两个核心模型:SenseVoice和CosyVoice。可以精准多语言识别并且进行语音克隆
本地一键包下载地址: SenseVoice - 精准多语言语音识别与情感辨识模型 本地一键整合包下载

**SenseVoice:**精准多语言识别与情感辨识
SenseVoice主要致力于高精度多语言语音识别、情感辨识和音频事件检测,经过40万小时数据训练,支持超过50种语言的识别,其效果显著优于现有的Whisper模型,尤其在中文和粤语识别上提升超过50%。该模型不仅能够准确识别语音,还能辨别音乐、掌声、笑声、哭声、咳嗽和喷嚏等常见人机交互事件。多方面的测试显示,SenseVoice在情感辨识能力上也取得了行业领先的成果,能够检测到多种情感表现。
CosyVoice 这里就不多介绍,可以参考之前发布的一键包,CosyVoice一键包点此进入

本地测试了多轮音频,识别能力还是挺棒的,相比Whisper,SenseVoice的中文识别能力更胜一筹,精准度也更高。
使用也很简单,下载一键包,双击一键启动,进入WebUI界面
上传一段需要识别的音频,点开始即可

相关推荐
eastyuxiao7 小时前
思维导图拆解项目范围 3 个真实落地案例
大数据·运维·人工智能·流程图
风落无尘7 小时前
《智能重生:从垃圾堆到AI工程师》——第五章 代码与灵魂
服务器·网络·人工智能
冬奇Lab8 小时前
RAG 系列(八):RAG 评估体系——用数据说话
人工智能·llm
landyjzlai9 小时前
蓝迪哥玩转Ai(8)---端侧AI:RK3588 端侧大语言模型(LLM)开发实战指南
人工智能·python
ZhengEnCi11 小时前
05-自注意力机制详解 🧠
人工智能·pytorch·深度学习
前端程序媛-Tian11 小时前
前端 AI 提效实战:从 0 到 1 打造团队专属 AI 代码评审工具
前端·人工智能·ai
weixin_4171970511 小时前
DeepSeek V4绑定华为:一场飞行中换引擎的国产算力革命
人工智能·华为
翼龙云_cloud11 小时前
阿里云代理商:阿里云深度适配DeepSeek V4让中小企业 AI零门槛上云
人工智能·阿里云·云计算·ai智能体·deepseek v4