SenseVoice - 阿里最新开源精准多语言语音识别与情感辨识模型 本地一键整合包下载


阿里巴巴近期发布了开源语音大模型项目FunAudioLLM,该项目包含了两个核心模型:SenseVoice和CosyVoice。可以精准多语言识别并且进行语音克隆
本地一键包下载地址: SenseVoice - 精准多语言语音识别与情感辨识模型 本地一键整合包下载

**SenseVoice:**精准多语言识别与情感辨识
SenseVoice主要致力于高精度多语言语音识别、情感辨识和音频事件检测,经过40万小时数据训练,支持超过50种语言的识别,其效果显著优于现有的Whisper模型,尤其在中文和粤语识别上提升超过50%。该模型不仅能够准确识别语音,还能辨别音乐、掌声、笑声、哭声、咳嗽和喷嚏等常见人机交互事件。多方面的测试显示,SenseVoice在情感辨识能力上也取得了行业领先的成果,能够检测到多种情感表现。
CosyVoice 这里就不多介绍,可以参考之前发布的一键包,CosyVoice一键包点此进入

本地测试了多轮音频,识别能力还是挺棒的,相比Whisper,SenseVoice的中文识别能力更胜一筹,精准度也更高。
使用也很简单,下载一键包,双击一键启动,进入WebUI界面
上传一段需要识别的音频,点开始即可

相关推荐
deephub4 分钟前
TPU 架构与 Pallas Kernel 编程入门:从内存层次结构到 FlashAttention
人工智能·python·深度学习·tpu
人工智能培训8 分钟前
少量样本下具身智能的新环境快速适应路径
人工智能·深度学习·机器学习
枫叶林FYL15 分钟前
【脑电图信号自动睡眠分期(机器学习驱动睡眠质量评估)】第二章 应用场景拓展、可穿戴集成与临床转化挑战
人工智能·深度学习·机器学习
K姐研究社16 分钟前
Pexo AI视频制作教程 – 零门槛生成UGC带货视频
人工智能
智能工业品检测-奇妙智能17 分钟前
绩效考核系统的核心功能
人工智能·目标检测·计算机视觉·奇妙智能
多租户观察室17 分钟前
工作流新生态:2026年工作流与Coding的重新分工
前端·人工智能·后端·低代码
枫叶林FYL18 分钟前
公开数据集类型汇总分类
人工智能·分类·数据挖掘
张驰咨询公司22 分钟前
电池制造进入“统计控制时代”:六西格玛如何解锁材料一致性的终极密码
人工智能·六西格玛培训·六西格玛绿带培训·精益六西格·六西格玛培训公司
FluxMelodySun26 分钟前
机器学习(二十六) 降维:流形学习
人工智能·机器学习
掘根31 分钟前
【微服务即时通讯】消息存储子服务1
微服务·架构·语音识别