机器学习评价指标之平均概念

宏平均(Macro-average)

宏平均计算每个类别的评价指标(如准确率、精确率、召回率、F1 分数等),然后对所有类别的指标进行平均。宏平均给予每个类别相同的权重,适用于各个类别的重要性相等的情况。

宏平均不会因为类别样本数量不同而偏向样本较多的类别。它关注每个类别的表现,适用于各个类别的重要性相等或相近的情况。

微平均(Micro-average)

微平均将所有类别的预测结果汇总起来,计算整体的评价指标。对所有类别的预测结果进行统一的计算,适用于类别样本不平衡的情况。以精确率为例,微平均的精确率为:

其中,TP 表示真正例(True Positive),FN 表示假负例(False Negative)。

微平均考虑了所有类别的样本数量,它会更关注样本数量多的类别,因为这些类别会对整体性能有更大的影响。微平均能够反映出模型在处理样本数量不平衡情况下的表现。

加权平均(Weighted Average)

加权平均考虑了类别样本数量的不平衡性,对每个类别的指标乘以对应类别的样本数量占总样本数量的比例,然后进行加权平均。这可以反映不同类别的重要性。

加权平均考虑了类别样本数量的不平衡性,对样本较多的类别给予更大的权重,从而更好地反映整体性能。它适用于类别样本数量差异较大的情况。

相关推荐
IT_陈寒1 小时前
Vite的热更新突然不香了,排查三小时差点砸键盘
前端·人工智能·后端
阿里云大数据AI技术3 小时前
构建高转化海外电商搜索:阿里云OpenSearch行业算法版的全链路智能优化策略实战
人工智能·搜索引擎
Awu12273 小时前
⚡从零开发 Agent CLI(五)实现一个可治理、可扩展的工具系统
前端·人工智能·claude
字节跳动视频云技术团队3 小时前
让 Agent 成为音视频工作台:AI MediaKit CLI + Skill 发布
人工智能·音视频开发
魏祖潇3 小时前
framework 整合实战——DDD/TDD/SDD 三件套在 framework 仓的真实落地
人工智能·后端
Token炼金师4 小时前
去噪扩散:从随机噪声到高保真图像的数学之路
人工智能·aigc
vibecoding日记4 小时前
双非如何快速入职字节等大厂大模型?真实案例分析:推理优化和投机解码
算法·求职·大模型工程师
这个DBA有点耶4 小时前
AI写的SQL跑崩了生产库,这锅谁背?
数据库·人工智能·程序员
阿里云大数据AI技术4 小时前
阿里云 EMR AI 助手正式发布:从问答工具到全栈智能运维助手
运维·人工智能