Fun-ASR-Nano实时语音识别并区分说话人 | FunASR | 开源实时语音识别模型

Luke Ewin2026-05-27 14:21

1. 实时语音识别

Fun-ASR-Nano是很好的开源的实时语音识别模型，可以使用FunASR运行，同时支持多种方言和国际语言，根据官方文档，支持客家话，吴语，赣语，四川话，河南话，天津话，北京话，东北话等，同时还支持英语，日语等国际语言。

Fun-ASR-Nano可以做到流式识别说话人，也就是通过麦克风实时转写的同时可以区分说话人，还会返回时间戳，通过打上SPK标识区分不同的人讲的话。可以应用在会议实时纪要项目中。

实际的效果可以看我发布的视频，在浏览器中打开下面的地址，观看演示视频。

shell 复制代码

https://www.bilibili.com/video/BV1YiVF6REJa

更多内容欢迎关注我。