fun-asr

从零开始部署Fun-ASR-Nano实时语音识别并区分说话人教程 | 私有化部署开源的实时语音转写项目在会议场景中，我们通常需要做会议纪要，并且最好是实时会议纪要，也就是领导一边讲话，系统应该一边出文字，同时可以做到区分说话人，并且是无需提前注册声纹信息，使用SPK标识。

B站视频脚本：手把手教你部署Fun-ASR语音识别系统在内容创作者、教育从业者和企业团队越来越依赖语音转文字技术的今天，一个稳定、高效又易于上手的本地化语音识别工具显得尤为珍贵。市面上虽然有不少云服务 API 可用，但隐私顾虑、网络延迟和持续调用成本始终是绕不开的问题。而 Fun-ASR WebUI 的出现，恰好填补了这一空白——它不仅集成了高精度的大模型能力，还通过图形界面让普通用户也能轻松完成部署与使用。

Fun-ASR-Nano实时语音识别并区分说话人 | FunASR | 开源实时语音识别模型Fun-ASR-Nano是很好的开源的实时语音识别模型，可以使用FunASR运行，同时支持多种方言和国际语言，根据官方文档，支持客家话，吴语，赣语，四川话，河南话，天津话，北京话，东北话等，同时还支持英语，日语等国际语言。

在中文普通话任务上，Fun-ASR准确率超越Whisper-small近5个百分点在智能语音技术飞速发展的今天，语音识别已不再是“能听清就行”的初级工具，而是迈向“听得准、理解对、用得稳”的关键能力。尤其是在中文场景下，用户对识别精度的要求越来越高——一句“三月二十号”不能变成“三二零号”，“钉钉会议”也不该被误识为“丁丁开会”。然而，尽管像 Whisper 这样的通用大模型在多语言任务中表现亮眼，面对中文普通话的复杂语境时，仍常出现术语不准、数字混乱、热词漏识等问题。

我是有底线的