SenseVoice - 阿里最新开源精准多语言语音识别与情感辨识模型 本地一键整合包下载


阿里巴巴近期发布了开源语音大模型项目FunAudioLLM,该项目包含了两个核心模型:SenseVoice和CosyVoice。可以精准多语言识别并且进行语音克隆
本地一键包下载地址: SenseVoice - 精准多语言语音识别与情感辨识模型 本地一键整合包下载

**SenseVoice:**精准多语言识别与情感辨识
SenseVoice主要致力于高精度多语言语音识别、情感辨识和音频事件检测,经过40万小时数据训练,支持超过50种语言的识别,其效果显著优于现有的Whisper模型,尤其在中文和粤语识别上提升超过50%。该模型不仅能够准确识别语音,还能辨别音乐、掌声、笑声、哭声、咳嗽和喷嚏等常见人机交互事件。多方面的测试显示,SenseVoice在情感辨识能力上也取得了行业领先的成果,能够检测到多种情感表现。
CosyVoice 这里就不多介绍,可以参考之前发布的一键包,CosyVoice一键包点此进入

本地测试了多轮音频,识别能力还是挺棒的,相比Whisper,SenseVoice的中文识别能力更胜一筹,精准度也更高。
使用也很简单,下载一键包,双击一键启动,进入WebUI界面
上传一段需要识别的音频,点开始即可

相关推荐
Chef_Chen16 分钟前
从0开始学习机器学习--Day32--推荐系统作业
人工智能·学习·机器学习
薛定谔的猫ovo19 分钟前
基函数、核函数与Kernel trick
人工智能·机器学习
檀越剑指大厂1 小时前
Linux本地部署开源项目OpenHands基于AI的软件开发代理平台及公网访问
linux·人工智能·开源
古月居GYH1 小时前
ROS一键安装脚本
人工智能·机器人·ros
蚂蚁没问题s1 小时前
图像处理 - 色彩空间转换
图像处理·人工智能·算法·机器学习·计算机视觉
forestsea1 小时前
Spring Boot 与 Java 决策树:构建智能分类系统
java·人工智能·spring boot·深度学习·决策树·机器学习·数据挖掘
无脑敲代码,bug漫天飞2 小时前
神经网络的初始化
人工智能·深度学习·神经网络
学习前端的小z2 小时前
【AIGC】如何准确引导ChatGPT,实现精细化GPTs指令生成
人工智能·gpt·chatgpt·aigc
Crossoads2 小时前
【汇编语言】call 和 ret 指令(一) —— 探讨汇编中的ret和retf指令以及call指令及其多种转移方式
android·开发语言·javascript·汇编·人工智能·数据挖掘·c#
kejijianwen3 小时前
沸蛇鼠标,多功能智慧AI,重新定义生产力
人工智能·计算机外设