目录
什么是AUC?
图片来源:https://towardsdatascience.com/understanding-auc-roc-curve-68b2303cc9c5
AUC(Area Under the ROC Curve)是一种用于评估二分类模型性能的指标 ,表示ROC曲线下的面积 。ROC(Receiver Operating Characteristic)曲线是一种以 False Positive Rate(FPR)为横坐标 、True Positive Rate(TPR)为纵坐标的曲线。
F P R = F P F P + T N FPR=\frac{FP}{FP+TN} FPR=FP+TNFP
T P R = T P T P + F N = R e c a l l TPR=\frac{TP}{TP+FN}=Recall TPR=TP+FNTP=Recall
在二分类问题中,TPR 表示正样本被正确预测为正样本的比例,即 Recall;FPR 则表示负样本被错误预测为正样本的比例。AUC 越大,说明分类器性能越好;AUC = 0.5,则说明分类器性能等同于随机分类。
在样本全为 TP(TN) 的情况下,由于 FPR(TPR) 无法计算,因此 ROC 曲线无法绘制,AUC(Area Under the ROC Curve)无法计算。
AUC 具有以下优点:
- AUC 不受分类器的阈值选择影响,因此对于不同的分类器比较性能更具有普适性。
- AUC 可以很好地应用于样本不平衡的情况,即当负样本比正样本多得多时,仍能准确评估分类器性能。
- AUC 的计算方法简单,只需要对 ROC 曲线下的面积进行计算即可。
如果觉得这篇文章有用,就给个赞 👍和收藏⭐️吧!也欢迎在评论区分享你的看法!
参考
- Classification: ROC and AUC by Google
- Understanding AUC - ROC Curve by Sarang Narkhede