机器学习 - 模型性能评估

F1度量

F1度量是用于评估分类模型性能的一个综合指标,它同时考虑了查准率(Precision, P)和查全率(Recall, R)。F1度量的公式如下:

F 1 = 2 × P × R P + R F1 = \frac{2 \times P \times R}{P + R} F1=P+R2×P×R

其中,查准率和查全率的定义分别是:

  • 查准率(P): P = T P T P + F P P = \frac{TP}{TP + FP} P=TP+FPTP
  • 查全率(R): R = T P T P + F N R = \frac{TP}{TP + FN} R=TP+FNTP

其中,TP(True Positive)是真正例,FP(False Positive)是假正例,FN(False Negative)是假负例。

F1度量也可以写成:

F 1 = 2 × T P 样例总数 + T P − T N F1 = \frac{2 \times TP}{\text{样例总数} + TP - TN} F1=样例总数+TP−TN2×TP

在右上角,还给出了F1的倒数形式:

1 F 1 = 1 2 ( 1 P + 1 R ) \frac{1}{F1} = \frac{1}{2} \left( \frac{1}{P} + \frac{1}{R} \right) F11=21(P1+R1)

加权F度量(Fβ)

如果我们对查准率和查全率有不同的偏好,可以使用加权F度量(Fβ),其中β是一个权重参数。Fβ的公式为:

F β = ( 1 + β 2 ) × P × R ( β 2 × P ) + R F_{\beta} = \frac{(1 + \beta^2) \times P \times R}{(\beta^2 \times P) + R} Fβ=(β2×P)+R(1+β2)×P×R

其中,β的值决定了查准率和查全率的权重:

  • 当β > 1时,查全率的权重更大。
  • 当β < 1时,查准率的权重更大。

在图片中,还给出了Fβ的倒数形式:

1 F β = 1 1 + β 2 ( 1 P + β 2 R ) \frac{1}{F_{\beta}} = \frac{1}{1 + \beta^2} \left( \frac{1}{P} + \frac{\beta^2}{R} \right) Fβ1=1+β21(P1+Rβ2)

这个公式可以帮助我们理解在不同的β值下,查准率和查全率对Fβ的贡献。

总结:

  • F1度量 是查准率和查全率的调和平均。
  • 加权F度量(Fβ) 允许我们对查准率和查全率给予不同的权重。
相关推荐
追光的蜗牛丿21 小时前
目标检测中的ROI Pooling
人工智能·目标检测·计算机视觉
缘华工业智维1 天前
工业设备预测性维护:能源成本降低的“隐藏钥匙”?
大数据·网络·人工智能
DooTask官方号1 天前
跨语言协作新范式:阿里云Qwen-MT与DooTask的翻译技术突破
人工智能·ai·项目管理·机器翻译·dootask
凯禾瑞华养老实训室1 天前
聚焦生活照护能力培育:老年生活照护实训室建设清单的模块设计与资源整合
大数据·人工智能·科技·ar·vr·智慧养老·智慧健康养老服务与管理
倔强青铜三1 天前
苦练Python第64天:从零掌握多线程,threading模块全面指南
人工智能·python·面试
格林威1 天前
偏振相机是否属于不同光谱相机的范围内
图像处理·人工智能·数码相机·计算机视觉·视觉检测·工业相机
A-大程序员1 天前
【pytorch】合并与分割
人工智能·pytorch·深度学习
AI新兵1 天前
AI大事记12:Transformer 架构——重塑 NLP 的革命性技术(上)
人工智能·自然语言处理·transformer
Q26433650231 天前
【有源码】基于Hadoop生态的大数据共享单车数据分析与可视化平台-基于Python与大数据的共享单车多维度数据分析可视化系统
大数据·hadoop·python·机器学习·数据分析·spark·毕业设计
Dongsheng_20191 天前
【汽车篇】AI深度学习在汽车零部件外观检测——刹车片中的应用
人工智能·汽车