语音识别指标计算 WER

目录

[CER(Character Error Rate)](#CER(Character Error Rate))

[WER = Word Error Rate(词错误率)](#WER = Word Error Rate(词错误率))

[🧮 WER 计算方式](#🧮 WER 计算方式)

[📌 示例](#📌 示例)

[✅ 理解要点](#✅ 理解要点)


CER(Character Error Rate)

语音识别中的 CER(Character Error Rate) 是衡量语音识别系统准确性的一个重要指标,表示预测文本与参考文本在字符级别上的差异程度。

CER(Character Error Rate)定义:

CER 是编辑距离(Levenshtein 距离)与参考文本字符总数的比值:

语音识别 WER 是什么意思

WER = Word Error Rate(词错误率)

在语音识别(ASR, Automatic Speech Recognition)领域,WER 是一个常用的性能评估指标,全称是:WER = Word Error Rate(词错误率)


🧮 WER 计算方式

WER 是通过比较 识别结果(Hypothesis)真实文本(Reference) 之间的差异来计算的,公式如下:

WER=S+D+IN\text{WER} = \frac{S + D + I}{N}WER=NS+D+I​

其中:

  • S(Substitutions):替换错误数(识别成了其他词)

  • D(Deletions):漏识别的词数

  • I(Insertions):多识别出的词数

  • N:真实文本中的词总数(即 Reference 中的词数)


📌 示例

假设真实文本是:

我 爱 自然语言处理

识别结果是:

我 喜欢 语言 处理

对比:

  • "爱" → "喜欢":1 个替换(S)

  • "自然" 被删掉:1 个删除(D)

  • 没有额外多出的词:0 个插入(I)

  • 总词数 N = 4

则:

WER=1(S)+1(D)+0(I)4=0.5=50%\text{WER} = \frac{1(S)+ 1(D)+ 0(I)}{4} = 0.5 = 50\%WER=41(S)+1(D)+0(I)​=0.5=50%


✅ 理解要点

  • WER 越低越好,0% 表示识别完全正确

  • 常见语音识别模型,比如 Whisper、Kaldi、Wav2Vec2,在高质量数据上 WER 可以低至 5% 以下。

  • 对于方言、多语种或嘈杂环境,WER 通常会高一些。

相关推荐
会飞的老朱2 小时前
医药集团数智化转型,智能综合管理平台激活集团管理新效能
大数据·人工智能·oa协同办公
聆风吟º3 小时前
CANN runtime 实战指南:异构计算场景中运行时组件的部署、调优与扩展技巧
人工智能·神经网络·cann·异构计算
Codebee5 小时前
能力中心 (Agent SkillCenter):开启AI技能管理新时代
人工智能
聆风吟º6 小时前
CANN runtime 全链路拆解:AI 异构计算运行时的任务管理与功能适配技术路径
人工智能·深度学习·神经网络·cann
uesowys6 小时前
Apache Spark算法开发指导-One-vs-Rest classifier
人工智能·算法·spark
AI_56786 小时前
AWS EC2新手入门:6步带你从零启动实例
大数据·数据库·人工智能·机器学习·aws
User_芊芊君子6 小时前
CANN大模型推理加速引擎ascend-transformer-boost深度解析:毫秒级响应的Transformer优化方案
人工智能·深度学习·transformer
智驱力人工智能7 小时前
小区高空抛物AI实时预警方案 筑牢社区头顶安全的实践 高空抛物检测 高空抛物监控安装教程 高空抛物误报率优化方案 高空抛物监控案例分享
人工智能·深度学习·opencv·算法·安全·yolo·边缘计算
qq_160144877 小时前
亲测!2026年零基础学AI的入门干货,新手照做就能上手
人工智能
Howie Zphile7 小时前
全面预算管理难以落地的核心真相:“完美模型幻觉”的认知误区
人工智能·全面预算