机器学习第十八讲:混淆矩阵 → 诊断模型在医疗检查中的误诊情况

机器学习第十八讲:混淆矩阵 → 诊断模型在医疗检查中的误诊情况

资料取自《零基础学机器学习》

查看总目录:学习大纲

关于DeepSeek本地部署指南可以看下我之前写的文章:DeepSeek R1本地与线上满血版部署:超详细手把手指南


混淆矩阵是模型诊断的体检报告,能清晰展示分类模型的各种"误诊"类型[^8-1]。通过医疗检查案例详细说明:

一、核心概念(类似疫情筛查报告)

假设医院用AI模型检测1000份血样,实际有50人感染病毒:
实际阳性 实际阴性 实际阳性 实际阴性 预测阳性 真阳性TP 假阳性FP 预测阴性 假阴性FN 真阴性TN

示例数据

| | 实际感染 | 实际健康 |

|----------------|---------|---------|

| 预测感染 | TP=45 | FP=10 |

| 预测健康 | FN=5 | TN=940 | [2][4]

二、关键指标解读(医生最关注的4个数据)

  1. 假阳性(误诊) :健康人被误判为感染者 → 造成过度治疗 [参考材料1]
  2. 假阴性(漏诊) :感染者被误判为健康 → 导致疫情扩散 [参考材料6]
  3. 精确率 = TP/(TP+FP) = 45/55 ≈ 81.8% → 预测感染者的可信度 [参考材料2]
  4. 召回率 = TP/(TP+FN) = 45/50 = 90% → 真实感染者的检出率 [参考材料6]

模型捕捉到 模型漏掉 被误判 正确排除 总样本1000 实际感染50 实际健康950 TP=45 FN=5 FP=10 TN=940

三、医疗场景应用(新冠肺炎检测案例)

案例背景 :CT影像AI诊断系统 [参考材料4]

  • 数据集:500张肺部CT(300新冠阳性,200阴性)

  • 模型预测结果:

    python 复制代码
    # 混淆矩阵数值
    [[275,  25],  # 真阳性275 | 假阳性25
     [ 15, 185]]  # 假阴性15 | 真阴性185

问题诊断

  1. 假阳性问题:25例健康人需复检 → 增加医疗资源消耗
  2. 假阴性危机:15例漏诊患者成为传染源 → 需提升模型灵敏度[^6]
  3. 平衡建议 :调整阈值使FN<5,即使FP増至40 [参考材料6]

类比说明:就像机场安检,过分严格(低FP)会延误旅客,过于宽松(低FN)会放过危险品,需权衡两者[^8-1]

四、可视化呈现(热力图诊断)

原始预测 标准化评估 颜色映射 异常值定位

实操步骤

  1. 用seaborn绘制热力矩阵 [参考材料3]

    python 复制代码
    sns.heatmap([[275,25],[15,185]], annot=True, cmap="Blues") 
  2. 深色块表示问题区域:

    • 左下角(15):急需减少的漏诊病例
    • 右上角(25):可容忍的误诊误差[^4]

优化效果

调参后矩阵变为:

复制代码
[[285, 35],
 [ 3, 177]]
  • 漏诊从15→3人,误诊从25→35人 → 更适合疫情管控 [参考材料6]

目录:总目录

上篇文章:机器学习第十七讲:PCA → 把100维数据压缩成3D视图仍保持主要特征

下篇文章:机器学习第十九讲:交叉验证 → 用五次模拟考试验证真实水平


\^8-1\][《零基础学机器学习》](https://u.jd.com/g6ohKvi)第八章第一/二节评估指标 \[^2\]\[^3\]\[^4\]\[^6\]参见医疗检测案例实践([《零基础学机器学习》](https://u.jd.com/g6ohKvi)心脏病预测章节)

相关推荐
云知谷4 小时前
【C++基本功】C++适合做什么,哪些领域适合哪些领域不适合?
c语言·开发语言·c++·人工智能·团队开发
rit84324994 小时前
基于MATLAB实现基于距离的离群点检测算法
人工智能·算法·matlab
初学小刘5 小时前
深度学习:从图片数据到模型训练(十分类)
人工智能·深度学习
递归不收敛6 小时前
大语言模型(LLM)入门笔记:嵌入向量与位置信息
人工智能·笔记·语言模型
之墨_7 小时前
【大语言模型】—— 自注意力机制及其变体(交叉注意力、因果注意力、多头注意力)的代码实现
人工智能·语言模型·自然语言处理
从孑开始7 小时前
ManySpeech.MoonshineAsr 使用指南
人工智能·ai·c#·.net·私有化部署·语音识别·onnx·asr·moonshine
涛涛讲AI7 小时前
一段音频多段字幕,让音频能够流畅自然对应字幕 AI生成视频,扣子生成剪映视频草稿
人工智能·音视频·语音识别
可触的未来,发芽的智生8 小时前
新奇特:黑猫警长的纳米世界,忆阻器与神经网络的智慧
javascript·人工智能·python·神经网络·架构
悟乙己8 小时前
MLops | 基于AWS Lambda 架构构建强大的机器学习(ML)血缘关系
机器学习·架构·aws
WWZZ20258 小时前
快速上手大模型:机器学习2(一元线性回归、代价函数、梯度下降法)
人工智能·算法·机器学习·计算机视觉·机器人·大模型·slam