解决方案:机器学习中,回归及分类常用的模型评估指标有哪些

文章目录

  • 一、现象
  • 二、解决方案
    • 回归任务的评价指标:
      • [均方误差 (MSE):](#均方误差 (MSE):)
      • [平均绝对误差 (MAE):](#平均绝对误差 (MAE):)
    • 分类任务的评价指标:
      • [准确率 (Accuracy):](#准确率 (Accuracy):)
      • [混淆矩阵 (Confusion Matrix):](#混淆矩阵 (Confusion Matrix):)
      • [精确度 (Precision):](#精确度 (Precision):)
      • [召回率 (Recall):](#召回率 (Recall):)
      • [F1分数 (F1 Score):](#F1分数 (F1 Score):)
      • [ROC曲线 (Receiver Operating Characteristic Curve):](#ROC曲线 (Receiver Operating Characteristic Curve):)
      • [AUC值 (Area Under the ROC Curve):](#AUC值 (Area Under the ROC Curve):)
      • [对数损失 (Log Loss) 或 交叉熵损失 (Cross-Entropy Loss):](#对数损失 (Log Loss) 或 交叉熵损失 (Cross-Entropy Loss):)

一、现象

在做模型建模做模型评估的时候,会用到模型评估指标,所以整理一下

二、解决方案

在机器学习中,回归和分类是两种常见的任务类型,它们各自有不同的评价指标来衡量模型的性能。

回归任务的评价指标:

均方误差 (MSE):

平均绝对误差 (MAE):

分类任务的评价指标:

准确率 (Accuracy):

Accuracy = 总样本数 / 正确分类的样本数

混淆矩阵 (Confusion Matrix):

一个表格,用于显示实际类别与模型预测类别之间的关系。

精确度 (Precision):

Precision = 真正例 / (真正例 + 假正例)

其中 TP 是真正例,TN 是真负例,FP 是假正例,FN 是假负例。

召回率 (Recall):

Recall = 真正例 / (真正例 + 假负例)

其中 TP 是真正例,TN 是真负例,FP 是假正例,FN 是假负例。

F1分数 (F1 Score):

F1 = (2 × Precision × Recall) / (Precision + Recall)

ROC曲线 (Receiver Operating Characteristic Curve):

绘制真正例率(TPR)和假正例率(FPR)的曲线。

真正例率(TPR),也称为召回率或灵敏度,计算公式为:TPR = TP / ( TP + FN )

其中TP是真正例的数量,即模型正确预测为正类的样本数;FN是假负例的数量,即模型错误预测为负类的正类样本数。

假正例率(FPR),计算公式为:FPR = FP / ( FP+TN )

其中FP是假正例的数量,即模型错误预测为正类的负类样本数;TN是真负例的数量,即模型正确预测为负类的样本数。

AUC值 (Area Under the ROC Curve):

ROC曲线下的面积,用于衡量模型的整体性能。

AUC值越接近1,表示模型的性能越好;AUC值为0.5时,表示模型的性能等同于随机猜测。

对数损失 (Log Loss) 或 交叉熵损失 (Cross-Entropy Loss):

这些指标可以帮助我们了解模型在不同方面的表现,例如偏差、方差、过拟合和欠拟合等。在实际应用中,通常会根据具体问题选择最合适的评价指标。

相关推荐
缺的不是资料,是学习的心12 分钟前
使用qwen作为基座训练分类大模型
python·机器学习·分类
Zda天天爱打卡1 小时前
【机器学习实战中阶】使用Python和OpenCV进行手语识别
人工智能·python·深度学习·opencv·机器学习
爱喝奶茶的企鹅1 小时前
AI Agent的规划系统:让Agent更智能地完成任务
机器学习
一叶_障目3 小时前
机器学习之决策树(DecisionTree——C4.5)
人工智能·决策树·机器学习
快手技术6 小时前
KwaiCoder-23BA4-v1:以 1/30 的成本训练全尺寸 SOTA 代码续写大模型
算法·机器学习·开源
BlackPercy7 小时前
【线性代数】列主元法求矩阵的逆
线性代数·机器学习·矩阵
EQUINOX17 小时前
3b1b线性代数基础
人工智能·线性代数·机器学习
Swift社区7 小时前
统计文本文件中单词频率的 Swift 与 Bash 实现详解
vue.js·leetcode·机器学习
加德霍克7 小时前
【机器学习】使用scikit-learn中的KNN包实现对鸢尾花数据集或者自定义数据集的的预测
人工智能·python·学习·机器学习·作业
沉木渡香7 小时前
[2025分类&时序异常检测指标R-AUC与VUS]
分类·数据挖掘·时序异常检测·vus·r-auc