技术栈

语音识别

朱昆 iamkun
2 天前
语音识别·fun-asr· whisper
在中文普通话任务上,Fun-ASR准确率超越Whisper-small近5个百分点在智能语音技术飞速发展的今天,语音识别已不再是“能听清就行”的初级工具,而是迈向“听得准、理解对、用得稳”的关键能力。尤其是在中文场景下,用户对识别精度的要求越来越高——一句“三月二十号”不能变成“三二零号”,“钉钉会议”也不该被误识为“丁丁开会”。然而,尽管像 Whisper 这样的通用大模型在多语言任务中表现亮眼,面对中文普通话的复杂语境时,仍常出现术语不准、数字混乱、热词漏识等问题。
王友初
10 天前
cmsis-nn· tinyml· 语音识别
CMSIS-NN加速神经网络语音识别你有没有想过,为什么你的智能手表能在不联网的情况下听懂“嘿,Siri”?为什么一个只有几十KB内存的MCU也能实时识别语音命令?这背后的关键,并不是魔法——而是 CMSIS-NN 。
我是有底线的