SenseVoice - 阿里最新开源精准多语言语音识别与情感辨识模型 本地一键整合包下载


阿里巴巴近期发布了开源语音大模型项目FunAudioLLM,该项目包含了两个核心模型:SenseVoice和CosyVoice。可以精准多语言识别并且进行语音克隆
本地一键包下载地址: SenseVoice - 精准多语言语音识别与情感辨识模型 本地一键整合包下载

**SenseVoice:**精准多语言识别与情感辨识
SenseVoice主要致力于高精度多语言语音识别、情感辨识和音频事件检测,经过40万小时数据训练,支持超过50种语言的识别,其效果显著优于现有的Whisper模型,尤其在中文和粤语识别上提升超过50%。该模型不仅能够准确识别语音,还能辨别音乐、掌声、笑声、哭声、咳嗽和喷嚏等常见人机交互事件。多方面的测试显示,SenseVoice在情感辨识能力上也取得了行业领先的成果,能够检测到多种情感表现。
CosyVoice 这里就不多介绍,可以参考之前发布的一键包,CosyVoice一键包点此进入

本地测试了多轮音频,识别能力还是挺棒的,相比Whisper,SenseVoice的中文识别能力更胜一筹,精准度也更高。
使用也很简单,下载一键包,双击一键启动,进入WebUI界面
上传一段需要识别的音频,点开始即可

相关推荐
前端不太难4 小时前
AI 系统设计的终局:从 Agent 到自治系统
人工智能·状态模式
麦哲思科技任甲林4 小时前
AI编程之需求分析与描述
人工智能·需求分析·ai编程·工作流编排·需求规格
峰向AI5 小时前
Vercel 官方出品,你的 24 小时 AI 编程助手
人工智能·github
小丑依然是我5 小时前
AntV Harness:LLM 自我进化的闭环优化系统
人工智能·openai
fpcc5 小时前
信号处理与AI中的卷积的关系
c++·人工智能·信号处理
基算仿真5 小时前
AI如何用MCP“玩转”仿真软件?
人工智能
大转转FE5 小时前
转转前端周刊第192期: 财务数仓 Claude AI Coding 应用实战
前端·人工智能
cd_949217215 小时前
灵析数智:以 AI GEO 重构品牌增长,领跑生成式引擎优化新赛道
人工智能·搜索引擎·重构
yunhuibin5 小时前
videopipe学习之demo运行
人工智能·深度学习·学习
晓晓不觉早5 小时前
Hermes Agent 与 OpenClaw 全面对比:从“宠物级”到“自我进化”的本地 AI Agent 之争
人工智能