Fun-ASR-Nano实时语音识别并区分说话人 | FunASR | 开源实时语音识别模型

1. 实时语音识别

Fun-ASR-Nano是很好的开源的实时语音识别模型,可以使用FunASR运行,同时支持多种方言和国际语言,根据官方文档,支持客家话,吴语,赣语,四川话,河南话,天津话,北京话,东北话等,同时还支持英语,日语等国际语言。

2. 流式区分说话人

Fun-ASR-Nano可以做到流式识别说话人,也就是通过麦克风实时转写的同时可以区分说话人,还会返回时间戳,通过打上SPK标识区分不同的人讲的话。可以应用在会议实时纪要项目中。

3. 实际效果演示

实际的效果可以看我发布的视频,在浏览器中打开下面的地址,观看演示视频。

shell 复制代码
https://www.bilibili.com/video/BV1YiVF6REJa

更多内容欢迎关注我。

相关推荐
叫我:松哥1 天前
基于Flask的在线考试刷题系统设计与实现,集智能练习、过程追踪、深度分析与个性化引导
数据库·人工智能·后端·python·flask·boostrap
Rain5091 天前
2.3. 安全配置:环境变量与 API 密钥管理
前端·人工智能·后端·安全·ai·node.js·ai编程
用户938515635071 天前
HTML5 Canvas 从入门到AI驱动游戏开发:手把手教你用原生JS打造飞机游戏与数据可视化
前端·javascript·人工智能
货拉拉技术1 天前
Huolala Figma MCP 原理与实践
人工智能·前端框架·html
劈星斩月1 天前
从“画图”到“算数”:GPU如何站上AI时代的C位
人工智能·gpu
hongyucai1 天前
OPENPi模型源码AI解读
人工智能
果丁智能1 天前
物联网智能锁赋能网约房与民宿:身份核验、远程授权的技术落地与成本优化方案
人工智能·物联网·智能家居
科技每日热闻1 天前
618 AI显示器选购指南!爱攻AGON AI定制芯片电竞显示器AG277UX,适合哪些玩家?
人工智能·科技·游戏·计算机外设
初圣魔门首席弟子1 天前
AI Agent 核心原理:工具调用(Function Calling)完整工作流程详解
前端·数据库·人工智能
MacroZheng1 天前
横空出世!Claude Code画图神器来了,比Visio快10倍!
java·人工智能·后端