机器学习中的混淆矩阵

温柔的行子2023-11-25 13:31

混淆矩阵 是用于评估分类模型性能的表格，它展示了模型在不同类别上的预测情况。对于二分类问题，混淆矩阵的构成如下：

假设有两个类别：正例（Positive）和负例（Negative）。

混淆矩阵的形式如下：

|-------|-------|-------|
| | 预测为正例 | 预测为负例 |
| 实际为正例 | TP | FN |
| 实际为负例 | FP | TN |

通过混淆矩阵，可以计算出多个性能指标，包括：

准确率（Accuracy）： 分类正确的样本数占总样本数的比例，计算公式为 (TP + TN) / (TP + TN + FP + FN)。
精确率（Precision）： 正例预测正确的比例，计算公式为 TP / (TP + FP)。
召回率（Recall）： 实际为正例的样本中被正确预测为正例的比例，计算公式为**TP / (TP + FN)**。
F1 分数（F1 Score）： 精确率和召回率的调和平均数 ，计算公式为**2 * (Precision * Recall) / (Precision + Recall)**。

这些指标提供了关于分类模型性能的综合信息，可以帮助评估模型在不同方面的表现。