1. 实时语音识别
Fun-ASR-Nano是很好的开源的实时语音识别模型,可以使用FunASR运行,同时支持多种方言和国际语言,根据官方文档,支持客家话,吴语,赣语,四川话,河南话,天津话,北京话,东北话等,同时还支持英语,日语等国际语言。
2. 流式区分说话人
Fun-ASR-Nano可以做到流式识别说话人,也就是通过麦克风实时转写的同时可以区分说话人,还会返回时间戳,通过打上SPK标识区分不同的人讲的话。可以应用在会议实时纪要项目中。
3. 实际效果演示
实际的效果可以看我发布的视频,在浏览器中打开下面的地址,观看演示视频。
shell
https://www.bilibili.com/video/BV1YiVF6REJa
更多内容欢迎关注我。