SenseVoice - 阿里最新开源精准多语言语音识别与情感辨识模型 本地一键整合包下载


阿里巴巴近期发布了开源语音大模型项目FunAudioLLM,该项目包含了两个核心模型:SenseVoice和CosyVoice。可以精准多语言识别并且进行语音克隆
本地一键包下载地址: SenseVoice - 精准多语言语音识别与情感辨识模型 本地一键整合包下载

**SenseVoice:**精准多语言识别与情感辨识
SenseVoice主要致力于高精度多语言语音识别、情感辨识和音频事件检测,经过40万小时数据训练,支持超过50种语言的识别,其效果显著优于现有的Whisper模型,尤其在中文和粤语识别上提升超过50%。该模型不仅能够准确识别语音,还能辨别音乐、掌声、笑声、哭声、咳嗽和喷嚏等常见人机交互事件。多方面的测试显示,SenseVoice在情感辨识能力上也取得了行业领先的成果,能够检测到多种情感表现。
CosyVoice 这里就不多介绍,可以参考之前发布的一键包,CosyVoice一键包点此进入

本地测试了多轮音频,识别能力还是挺棒的,相比Whisper,SenseVoice的中文识别能力更胜一筹,精准度也更高。
使用也很简单,下载一键包,双击一键启动,进入WebUI界面
上传一段需要识别的音频,点开始即可

相关推荐
肖遥Janic12 分钟前
Stable Diffusion绘画 | 文生图-高分辨率修复-Hires.fix
人工智能·ai·ai作画·stable diffusion·ai绘画
学步_技术19 分钟前
人工智能深度学习系列—深入探索IoU Loss及其变种:目标检测与分割的精度优化利器
人工智能·深度学习·目标检测·机器学习·计算机视觉·分类·自动驾驶
๑҉ 晴天24 分钟前
使用Deeplearning4j进行深度学习
人工智能·深度学习
小李很执着26 分钟前
未来已来:全方位掌握【人工智能】的系统学习路线
人工智能·学习·算法·语言模型·自然语言处理·数据分析
2401_8650852129 分钟前
数字人直播系统,开启24小时不间断互动直播新时代!
人工智能
Yan-英杰1 小时前
腾讯云AI代码助手:AI辅助编写测试用例,测试从此不求人
人工智能·测试用例·腾讯云·腾讯云ai代码助手·腾讯云ai编程达人秀
幂简集成1 小时前
如何在C++、PHP、GO中使用AI生成PPT API接口
人工智能·api
小鹿学姐1 小时前
【数据驱动领域EI会议推荐】2024年智能电力系统与数据驱动创新国际研讨会(IPSDDI 2024)
人工智能·深度学习·算法·5g
道可云1 小时前
道可云元宇宙每日资讯|第十二届互联网安全大会在北京开幕
大数据·人工智能·3d·ar
微凉的衣柜1 小时前
端到端自动驾驶:终局还是误区?
人工智能·机器学习·自动驾驶