机器学习第十八讲：混淆矩阵 → 诊断模型在医疗检查中的误诊情况

查看总目录：学习大纲

混淆矩阵是模型诊断的体检报告，能清晰展示分类模型的各种"误诊"类型[^8-1]。通过医疗检查案例详细说明：

假设医院用AI模型检测1000份血样，实际有50人感染病毒：
实际阳性实际阴性实际阳性实际阴性预测阳性真阳性TP 假阳性FP 预测阴性假阴性FN 真阴性TN

示例数据 ：

| | 实际感染 | 实际健康 |

|----------------|---------|---------|

| 预测感染 | TP=45 | FP=10 |

| 预测健康 | FN=5 | TN=940 | [^2][4]

模型捕捉到模型漏掉被误判正确排除总样本1000 实际感染50 实际健康950 TP=45 FN=5 FP=10 TN=940

案例背景 ：CT影像AI诊断系统 [参考材料4]

模型预测结果：

python 复制代码

# 混淆矩阵数值
[[275,  25],  # 真阳性275 | 假阳性25
 [ 15, 185]]  # 假阴性15 | 真阴性185

问题诊断：

类比说明：就像机场安检，过分严格（低FP）会延误旅客，过于宽松（低FN）会放过危险品，需权衡两者[^8-1]

原始预测标准化评估颜色映射异常值定位

实操步骤：

用seaborn绘制热力矩阵 [参考材料3]
python 复制代码
```
sns.heatmap([[275,25],[15,185]], annot=True, cmap="Blues") 
```
深色块表示问题区域：
- 左下角(15)：急需减少的漏诊病例
- 右上角(25)：可容忍的误诊误差[^4]

优化效果 ：

调参后矩阵变为：

复制代码

[[285, 35],
 [ 3, 177]]

\^8-1\][《零基础学机器学习》](https://u.jd.com/g6ohKvi)第八章第一/二节评估指标 \[^2\]\[^3\]\[^4\]\[^6\]参见医疗检测案例实践（[《零基础学机器学习》](https://u.jd.com/g6ohKvi)心脏病预测章节）