【机器学习300问】102、什么是混淆矩阵?

一、混淆矩阵的定义

**混淆矩阵是一种用于评估分类模型性能的评估指标。**当模型对数据进行预测并将数据分配到预定义的类别时,混淆矩阵提供了一种直观的方式来总结这些预测与数据实际类别之间的对应关系。具体来说,它是一个表格

二、分类模型性能评估一级指标

分类模型的性能评估指标有三个等级,一级评估指标如下:

  1. 真正例(True Positives, TP):模型预测为正类,实际上也是正类的样本数。
  2. 假正例(False Positives, FP):模型预测为正类,但实际上为负类的样本数。
  3. 真负例(True Negatives, TN):模型预测为负类,实际上也是负类的样本数。
  4. 假负例(False Negatives, FN):模型预测为负类,但实际上为正类的样本数。

混淆矩阵就是根据一级分类指标得到的一张表。

我自己的理解是三句话:

**第一句:**分类你可以理解成猜迷,猜的对不对用"T真,F假"来表示。

**第二句:**你猜的这个东西的时候,你猜测它类别是"P正"还是"N负"。

**第三句:**你猜的这个东西,它本身的分类用"标签label"表示。

所以按照上面的三句话理解,举几个例子:

情况一:这个东西,本来的"标签"是"正"的,我猜它是"正",意味着我猜对了,故TP。

情况二:这个东西,本来的"标签"是"负"的,我猜它是"负",意味着我猜对了,故TN。

情况三:这个东西,本来的"标签"是"正"的,我猜它是"负",意味着我猜错了,故FN。

情况四:这个东西,本来的"标签"是"负"的,我猜它是"正",意味着我猜错了,故FP。

二、分类模型性能评估二级指标

分类模型的二级评估指标在之前的文章中提到过,但没有总结过。因此在本文章简单总结一下:

|--------------------------------|-------------------------------------------------------------------------------------------------------------------------------------|-------------------------------|
| 二级指标 | 公式 | 意义 |
| 准确率(Accuracy) | | 分类模型所有判断正确的结果占总观测值的比重 |
| 精确率(Precision) | | 在模型预测是Positive的所有结果中,模型预测对的比重 |
| 召回率(Recall) (又叫灵敏度Sensitivity) | | 在真实值是Positive的所有结果中,模型预测对的比重 |
| 特异度(Specificity) | | 在真实值是Negative的所有结果中,模型预测对的比重 |
[四个二级指标]

更多更详细的知识点,在往期文章中有提到,下面是跳转链接:

【机器学习300问】25、常见的模型评估指标有哪些?https://blog.csdn.net/qq_39780701/article/details/136407056

三、分类模型新能评估三级指标

分类模型的三级评估指标就是F1分数,在之前的文章中提到过。这里就不赘述了。

【机器学习300问】32、F1分数是什么?https://blog.csdn.net/qq_39780701/article/details/136607068

四、混淆矩阵举例说明

以一个图片多分类问题为例,想要判断一张图片是"猫"、"狗"和"猪"其中的哪一种。

混淆矩阵中的数值是样本数量,如果我们要计算准确率accuracy,那么可以统计所有表中数字的总和做分母。对角线相加做分子(因为对角线上的元素代表模型预测结果是正确的)。可以算出

相关推荐
老百姓懂点AI7 分钟前
[WASM实战] 插件系统的安全性:智能体来了(西南总部)AI调度官的WebAssembly沙箱与AI agent指挥官的动态加载
人工智能·wasm
多米Domi0111 小时前
0x3f 第49天 面向实习的八股背诵第六天 过了一遍JVM的知识点,看了相关视频讲解JVM内存,垃圾清理,买了plus,稍微看了点确定一下方向
jvm·数据结构·python·算法·leetcode
人工智能训练7 小时前
【极速部署】Ubuntu24.04+CUDA13.0 玩转 VLLM 0.15.0:预编译 Wheel 包 GPU 版安装全攻略
运维·前端·人工智能·python·ai编程·cuda·vllm
yaoming1687 小时前
python性能优化方案研究
python·性能优化
源于花海7 小时前
迁移学习相关的期刊和会议
人工智能·机器学习·迁移学习·期刊会议
码云数智-大飞8 小时前
使用 Python 高效提取 PDF 中的表格数据并导出为 TXT 或 Excel
python
DisonTangor9 小时前
DeepSeek-OCR 2: 视觉因果流
人工智能·开源·aigc·ocr·deepseek
薛定谔的猫19829 小时前
二十一、基于 Hugging Face Transformers 实现中文情感分析情感分析
人工智能·自然语言处理·大模型 训练 调优
发哥来了9 小时前
《AI视频生成技术原理剖析及金管道·图生视频的应用实践》
人工智能
biuyyyxxx9 小时前
Python自动化办公学习笔记(一) 工具安装&教程
笔记·python·学习·自动化