技术栈

whisper

朱昆 iamkun
5 小时前
语音识别·fun-asr· whisper
在中文普通话任务上,Fun-ASR准确率超越Whisper-small近5个百分点在智能语音技术飞速发展的今天,语音识别已不再是“能听清就行”的初级工具,而是迈向“听得准、理解对、用得稳”的关键能力。尤其是在中文场景下,用户对识别精度的要求越来越高——一句“三月二十号”不能变成“三二零号”,“钉钉会议”也不该被误识为“丁丁开会”。然而,尽管像 Whisper 这样的通用大模型在多语言任务中表现亮眼,面对中文普通话的复杂语境时,仍常出现术语不准、数字混乱、热词漏识等问题。
我是有底线的