解决方案:机器学习中,回归及分类常用的模型评估指标有哪些

文章目录

  • 一、现象
  • 二、解决方案
    • 回归任务的评价指标:
      • [均方误差 (MSE):](#均方误差 (MSE):)
      • [平均绝对误差 (MAE):](#平均绝对误差 (MAE):)
    • 分类任务的评价指标:
      • [准确率 (Accuracy):](#准确率 (Accuracy):)
      • [混淆矩阵 (Confusion Matrix):](#混淆矩阵 (Confusion Matrix):)
      • [精确度 (Precision):](#精确度 (Precision):)
      • [召回率 (Recall):](#召回率 (Recall):)
      • [F1分数 (F1 Score):](#F1分数 (F1 Score):)
      • [ROC曲线 (Receiver Operating Characteristic Curve):](#ROC曲线 (Receiver Operating Characteristic Curve):)
      • [AUC值 (Area Under the ROC Curve):](#AUC值 (Area Under the ROC Curve):)
      • [对数损失 (Log Loss) 或 交叉熵损失 (Cross-Entropy Loss):](#对数损失 (Log Loss) 或 交叉熵损失 (Cross-Entropy Loss):)

一、现象

在做模型建模做模型评估的时候,会用到模型评估指标,所以整理一下

二、解决方案

在机器学习中,回归和分类是两种常见的任务类型,它们各自有不同的评价指标来衡量模型的性能。

回归任务的评价指标:

均方误差 (MSE):

平均绝对误差 (MAE):

分类任务的评价指标:

准确率 (Accuracy):

Accuracy = 总样本数 / 正确分类的样本数

混淆矩阵 (Confusion Matrix):

一个表格,用于显示实际类别与模型预测类别之间的关系。

精确度 (Precision):

Precision = 真正例 / (真正例 + 假正例)

其中 TP 是真正例,TN 是真负例,FP 是假正例,FN 是假负例。

召回率 (Recall):

Recall = 真正例 / (真正例 + 假负例)

其中 TP 是真正例,TN 是真负例,FP 是假正例,FN 是假负例。

F1分数 (F1 Score):

F1 = (2 × Precision × Recall) / (Precision + Recall)

ROC曲线 (Receiver Operating Characteristic Curve):

绘制真正例率(TPR)和假正例率(FPR)的曲线。

真正例率(TPR),也称为召回率或灵敏度,计算公式为:TPR = TP / ( TP + FN )

其中TP是真正例的数量,即模型正确预测为正类的样本数;FN是假负例的数量,即模型错误预测为负类的正类样本数。

假正例率(FPR),计算公式为:FPR = FP / ( FP+TN )

其中FP是假正例的数量,即模型错误预测为正类的负类样本数;TN是真负例的数量,即模型正确预测为负类的样本数。

AUC值 (Area Under the ROC Curve):

ROC曲线下的面积,用于衡量模型的整体性能。

AUC值越接近1,表示模型的性能越好;AUC值为0.5时,表示模型的性能等同于随机猜测。

对数损失 (Log Loss) 或 交叉熵损失 (Cross-Entropy Loss):

这些指标可以帮助我们了解模型在不同方面的表现,例如偏差、方差、过拟合和欠拟合等。在实际应用中,通常会根据具体问题选择最合适的评价指标。

相关推荐
硅谷秋水6 小时前
HARBOR:一个面向具身智体机器人强化学习的驾驭框架
人工智能·深度学习·机器学习·机器人
Rocky Ding*8 小时前
Latent Consistency Models:一篇读懂扩散模型的少步生成核心基础知识
人工智能·深度学习·机器学习·ai作画·stable diffusion·aigc·ai-native
学术头条9 小时前
清华团队开源SCAIL-2:角色动画告别骨骼依赖,端到端还原视频中动作细节
人工智能·科技·机器学习·ai·开源·音视频·agi
Black蜡笔小新9 小时前
制造业AI质检工作站/企业AI算力工作站DLTM助力制造业质检智能化升级
人工智能·深度学习·机器学习
@insist1239 小时前
系统架构设计师-嵌入式处理器核心知识体系:从分类到架构选型全解析
架构·分类·系统架构·软考·系统架构设计师·软件水平考试
大C聊AI11 小时前
通用大模型纷纷收费,垂直场景AI工具的价值正在被重估
大数据·人工智能·机器学习·办公效率·ai 工具·智标领航·ai 辅助办公
苏州邦恩精密11 小时前
2026江苏GOM三维扫描仪定制厂家找哪家?企业数字化转型视角
人工智能·机器学习·3d·自动化·制造
王小王-12312 小时前
基于机器学习算法的恶意软件行为分析与检测系统设计与实现
机器学习·pyqt5·检测系统·恶意软件行为检测
Godspeed Zhao13 小时前
Level 4自动驾驶系统设计0——功能与场景0
人工智能·机器学习·自动驾驶