语音识别

小馬锅12 天前
语音识别·fun-asr· 本地部署
B站视频脚本:手把手教你部署Fun-ASR语音识别系统在内容创作者、教育从业者和企业团队越来越依赖语音转文字技术的今天,一个稳定、高效又易于上手的本地化语音识别工具显得尤为珍贵。市面上虽然有不少云服务 API 可用,但隐私顾虑、网络延迟和持续调用成本始终是绕不开的问题。而 Fun-ASR WebUI 的出现,恰好填补了这一空白——它不仅集成了高精度的大模型能力,还通过图形界面让普通用户也能轻松完成部署与使用。
Paula-柒月拾12 天前
语音识别·linly-talker· 中英文混读
Linly-Talker如何处理中英文混读?语音识别适配策略在当今数字人系统广泛应用于虚拟主播、智能客服和企业级对话代理的背景下,用户对交互自然性的要求已经远超“能听懂”这一基础标准。真实场景中的语言表达往往是复杂且不规则的——尤其是在科技、金融、教育等领域,人们习惯性地在中文语境中插入英文术语,比如“这个 model 的 accuracy 还不错”、“我用 GPU 跑了一下 inference”。如果系统无法准确理解这种混合表达,轻则造成误解,重则让用户体验瞬间断裂。
朱昆 iamkun4 个月前
语音识别·fun-asr· whisper
在中文普通话任务上,Fun-ASR准确率超越Whisper-small近5个百分点在智能语音技术飞速发展的今天,语音识别已不再是“能听清就行”的初级工具,而是迈向“听得准、理解对、用得稳”的关键能力。尤其是在中文场景下,用户对识别精度的要求越来越高——一句“三月二十号”不能变成“三二零号”,“钉钉会议”也不该被误识为“丁丁开会”。然而,尽管像 Whisper 这样的通用大模型在多语言任务中表现亮眼,面对中文普通话的复杂语境时,仍常出现术语不准、数字混乱、热词漏识等问题。
王友初4 个月前
cmsis-nn· tinyml· 语音识别
CMSIS-NN加速神经网络语音识别你有没有想过,为什么你的智能手表能在不联网的情况下听懂“嘿,Siri”?为什么一个只有几十KB内存的MCU也能实时识别语音命令?这背后的关键,并不是魔法——而是 CMSIS-NN 。
我是有底线的