【学习笔记】混淆矩阵

混淆矩阵(Confusion Matrix),又称为错误矩阵,是一种特别适用于监督学习中分类问题评估模型性能的工具。在机器学习领域,混淆矩阵能够清晰地显示算法模型的分类结果和实际情况之间的差异,常用于二分类和多分类问题。

一个基本的二分类混淆矩阵包含四个部分:

  1. 真正类(True Positive, TP):模型正确预测为正类的样本数。
  2. 假正类(False Positive, FP):模型错误预测为正类的样本数,实际上它们是负类。
  3. 真负类(True Negative, TN):模型正确预测为负类的样本数。
  4. 假负类(False Negative, FN):模型错误预测为负类的样本数,实际上它们是正类。

混淆矩阵通常以表格形式表示,对于二分类问题,其形式如下:

通过混淆矩阵,我们可以计算出多种性能指标来评估分类模型的性能,如准确率(Accuracy)、精确率(Precision)、召回率(Recall)或者真正率(True Positive Rate,TPR)、假正率(False Positive Rate,FPR)以及F1分数等。

准确率(Accuracy)是最直观的性能指标,计算公式为:
A c c u r a c y = T P + T N T P + T N + F P + F N Accuracy = \frac {TP + TN} {TP + TN + FP + FN} Accuracy=TP+TN+FP+FNTP+TN

精确率(Precision)关注的是预测为正类的样本中有多少是真正的正类,计算公式为:
P r e c i s i o n = T P T P + F P Precision = \frac {TP }{TP + FP} Precision=TP+FPTP

召回率(Recall)或真正率(TPR)关注的是所有真正的正类样本中有多少被模型预测为正类,计算公式为:
R e c a l l = T P T P + F N Recall = \frac {TP}{TP + FN} Recall=TP+FNTP

F1分数是精确率和召回率的调和平均值,计算公式为:
F 1 = 2 ∗ ( P r e c i s i o n ∗ R e c a l l ) P r e c i s i o n + R e c a l l F1 = \frac {2 * (Precision * Recall) }{Precision + Recall} F1=Precision+Recall2∗(Precision∗Recall)

对于多分类问题,混淆矩阵会更大,每一行代表实际类别,每一列代表预测类别,但计算各项指标的原理与二分类问题相同。

混淆矩阵的优点在于它不仅提供了错误分类的数量,还告诉我们哪些类别的预测错误最多,这对于改进分类算法和模型调优非常有帮助。

相关推荐
果冻人工智能4 分钟前
AI军备竞赛:我们是不是正在造一个无法控制的神?
人工智能
暴龙胡乱写博客10 分钟前
OpenCV---图像预处理(四)
人工智能·opencv·计算机视觉
程序员辣条17 分钟前
深度测评 RAG 应用评估框架:指标最全面的 RAGas
人工智能·程序员
无心水18 分钟前
【Java面试笔记:基础】8.对比Vector、ArrayList、LinkedList有何区别?
java·笔记·面试·vector·arraylist·linkedlist
curdcv_po18 分钟前
字节跳动Trae:一款革命性的免费AI编程工具完全评测
人工智能·trae
程序员辣条19 分钟前
为什么需要提示词工程?什么是提示词工程(prompt engineering)?为什么需要提示词工程?收藏我这一篇就够了!
人工智能·程序员·产品经理
孔令飞23 分钟前
Go:终于有了处理未定义字段的实用方案
人工智能·云原生·go
卡皮巴拉爱吃小蛋糕26 分钟前
MySQL的MVCC【学习笔记】
数据库·笔记·mysql
清流君36 分钟前
【MySQL】数据库 Navicat 可视化工具与 MySQL 命令行基本操作
数据库·人工智能·笔记·mysql·ue5·数字孪生
Blossom.11843 分钟前
人工智能在智能家居中的应用与发展
人工智能·深度学习·机器学习·智能家居·vr·虚拟现实·多模态融合