解决方案:机器学习中,回归及分类常用的模型评估指标有哪些

文章目录

  • 一、现象
  • 二、解决方案
    • 回归任务的评价指标:
      • [均方误差 (MSE):](#均方误差 (MSE):)
      • [平均绝对误差 (MAE):](#平均绝对误差 (MAE):)
    • 分类任务的评价指标:
      • [准确率 (Accuracy):](#准确率 (Accuracy):)
      • [混淆矩阵 (Confusion Matrix):](#混淆矩阵 (Confusion Matrix):)
      • [精确度 (Precision):](#精确度 (Precision):)
      • [召回率 (Recall):](#召回率 (Recall):)
      • [F1分数 (F1 Score):](#F1分数 (F1 Score):)
      • [ROC曲线 (Receiver Operating Characteristic Curve):](#ROC曲线 (Receiver Operating Characteristic Curve):)
      • [AUC值 (Area Under the ROC Curve):](#AUC值 (Area Under the ROC Curve):)
      • [对数损失 (Log Loss) 或 交叉熵损失 (Cross-Entropy Loss):](#对数损失 (Log Loss) 或 交叉熵损失 (Cross-Entropy Loss):)

一、现象

在做模型建模做模型评估的时候,会用到模型评估指标,所以整理一下

二、解决方案

在机器学习中,回归和分类是两种常见的任务类型,它们各自有不同的评价指标来衡量模型的性能。

回归任务的评价指标:

均方误差 (MSE):

平均绝对误差 (MAE):

分类任务的评价指标:

准确率 (Accuracy):

Accuracy = 总样本数 / 正确分类的样本数

混淆矩阵 (Confusion Matrix):

一个表格,用于显示实际类别与模型预测类别之间的关系。

精确度 (Precision):

Precision = 真正例 / (真正例 + 假正例)

其中 TP 是真正例,TN 是真负例,FP 是假正例,FN 是假负例。

召回率 (Recall):

Recall = 真正例 / (真正例 + 假负例)

其中 TP 是真正例,TN 是真负例,FP 是假正例,FN 是假负例。

F1分数 (F1 Score):

F1 = (2 × Precision × Recall) / (Precision + Recall)

ROC曲线 (Receiver Operating Characteristic Curve):

绘制真正例率(TPR)和假正例率(FPR)的曲线。

真正例率(TPR),也称为召回率或灵敏度,计算公式为:TPR = TP / ( TP + FN )

其中TP是真正例的数量,即模型正确预测为正类的样本数;FN是假负例的数量,即模型错误预测为负类的正类样本数。

假正例率(FPR),计算公式为:FPR = FP / ( FP+TN )

其中FP是假正例的数量,即模型错误预测为正类的负类样本数;TN是真负例的数量,即模型正确预测为负类的样本数。

AUC值 (Area Under the ROC Curve):

ROC曲线下的面积,用于衡量模型的整体性能。

AUC值越接近1,表示模型的性能越好;AUC值为0.5时,表示模型的性能等同于随机猜测。

对数损失 (Log Loss) 或 交叉熵损失 (Cross-Entropy Loss):

这些指标可以帮助我们了解模型在不同方面的表现,例如偏差、方差、过拟合和欠拟合等。在实际应用中,通常会根据具体问题选择最合适的评价指标。

相关推荐
AI医影跨模态组学16 分钟前
J Clin Oncol(IF=43.4)美国Cedars-Sinai医学中心等团队:基于计算组织学人工智能的晚期胰腺癌化疗选择预测性生物标志物的开发与验证
人工智能·机器学习·论文·医学·医学影像·影像组学
温九味闻醉1 小时前
关于腾讯广告算法大赛2025项目分析3-重读
人工智能·机器学习
AI医影跨模态组学4 小时前
Cancer Letters(IF=10.1)中山大学附属第六医院等团队:基于治疗前MRI影像的RCMIX模型预测MRI定义的cT4期直肠癌T分期下降
人工智能·机器学习·论文·医学·医学影像·影像组学
染指11106 小时前
3.AI大模型-token是什么-大模型底层运行机制
人工智能·算法·机器学习
南宫萧幕7 小时前
基于 Simulink 与 Python 联合仿真的 eVTOL 强化学习全链路实战
开发语言·人工智能·python·算法·机器学习·控制
哥布林学者7 小时前
深度学习进阶(二十二)T5:NLP任务的首次大一统
机器学习·ai
通信小呆呆8 小时前
注意力机制用于信号同步:从匹配滤波到可学习对齐
人工智能·学习·机器学习·信息与通信
初心未改HD10 小时前
机器学习之梯度提升与XGBoost详解
人工智能·机器学习
redgxp10 小时前
启发式算法WebApp实验室:从搜索策略到群体智能的能力进阶(七)
人工智能·机器学习·数据挖掘
热心网友俣先生11 小时前
2026年认证杯二阶段A题赛题解析
人工智能·算法·机器学习