召回率（Recall）

召回率（Recall）是分类模型评估的核心指标之一，主要衡量模型对"真实正类样本"的"识别能力"------即所有真正属于正类的样本中，被模型成功预测为正类的比例。它的计算依赖于"混淆矩阵"（Confusion Matrix）中的两个关键指标，需先理解基础概念再推导公式。

在二分类问题中（比如"判断邮件是否为垃圾邮件""检测肿瘤是否为恶性"），模型的预测结果与真实情况会产生4种组合，构成混淆矩阵：

真实情况\预测结果	预测为正类（Positive）	预测为负类（Negative）
真实正类（Positive）	TP（真正例）	FN（假负例）
真实负类（Negative）	FP（假正例）	TN（真负例）

对这4个指标的通俗解释（以"肿瘤检测"为例，正类=恶性肿瘤，负类=良性肿瘤）：

召回率的核心是"抓全真实正类"，因此公式聚焦于 "真实正类中被正确预测的比例"：

\\text{召回率（Recall）} = \\frac{\\text{TP（真正例）}}{\\text{TP（真正例）} + \\text{FN（假负例）}}

以"垃圾邮件识别"为例（正类=垃圾邮件，负类=正常邮件）：

假设模型处理了100封真实垃圾邮件（TP + FN = 100），其中：

代入公式计算：

\\text{召回率} = \\frac{85}{85 + 15} = \\frac{85}{100} = 0.85 \\quad (\\text{即85%})

这意味着：所有真实垃圾邮件中，85%被模型成功识别，15%被漏判为正常邮件。

召回率的价值体现在"对漏判敏感的场景"------即"宁可误判，不能漏判"的情况：

⚠️ 注意：召回率通常与"精确率（Precision）"存在权衡关系------提高召回率可能导致精确率下降（比如为了不漏判癌症，把更多良性判为恶性，导致误判增加），需根据业务需求平衡两者（常用F1分数综合评估）。

如果是多分类（比如识别"猫、狗、鸟"），召回率需按"每一类"单独计算，再通过两种方式综合：

日常场景中，二分类的召回率是基础，理解后可轻松扩展到多分类。