fun-asr

Luke Ewin12 天前
人工智能·语音识别·funasr·实时语音识别·fun-asr
从零开始部署Fun-ASR-Nano实时语音识别并区分说话人教程 | 私有化部署开源的实时语音转写项目在会议场景中,我们通常需要做会议纪要,并且最好是实时会议纪要,也就是领导一边讲话,系统应该一边出文字,同时可以做到区分说话人,并且是无需提前注册声纹信息,使用SPK标识。
小馬锅12 天前
语音识别·fun-asr· 本地部署
B站视频脚本:手把手教你部署Fun-ASR语音识别系统在内容创作者、教育从业者和企业团队越来越依赖语音转文字技术的今天,一个稳定、高效又易于上手的本地化语音识别工具显得尤为珍贵。市面上虽然有不少云服务 API 可用,但隐私顾虑、网络延迟和持续调用成本始终是绕不开的问题。而 Fun-ASR WebUI 的出现,恰好填补了这一空白——它不仅集成了高精度的大模型能力,还通过图形界面让普通用户也能轻松完成部署与使用。
Luke Ewin15 天前
人工智能·语音识别·asr·fun-asr
Fun-ASR-Nano实时语音识别并区分说话人 | FunASR | 开源实时语音识别模型Fun-ASR-Nano是很好的开源的实时语音识别模型,可以使用FunASR运行,同时支持多种方言和国际语言,根据官方文档,支持客家话,吴语,赣语,四川话,河南话,天津话,北京话,东北话等,同时还支持英语,日语等国际语言。
朱昆 iamkun4 个月前
语音识别·fun-asr· whisper
在中文普通话任务上,Fun-ASR准确率超越Whisper-small近5个百分点在智能语音技术飞速发展的今天,语音识别已不再是“能听清就行”的初级工具,而是迈向“听得准、理解对、用得稳”的关键能力。尤其是在中文场景下,用户对识别精度的要求越来越高——一句“三月二十号”不能变成“三二零号”,“钉钉会议”也不该被误识为“丁丁开会”。然而,尽管像 Whisper 这样的通用大模型在多语言任务中表现亮眼,面对中文普通话的复杂语境时,仍常出现术语不准、数字混乱、热词漏识等问题。
我是有底线的