面试:正确率能很好的评估分类算法吗

正确率(accuracy) 正确率是我们最常见的评价指标,accuracy = (TP+TN)/(P+N),正确率是被分对的样本数在所有样本数中的占比,通常来说,正确率越高,分类器越好。

不同算法有不同特点,在不同数据集上有不同的表现效果,根据特定的任务选择不同的算法。如何评价分类算法的好坏,要做具体任务具体分析。对于决策树,主要用正确率去评估,但是其他算法,只用正确率能很好的评估吗?

答案是否定的。

正确率确实是一个很直观很好的评价指标,但是有时候正确率高并不能完全代表一个算法就好。比如对某个地区进行地震预测,地震分类属性分为0:不发生地震、1发生地震。我们都知道,不发生的概率是极大的,对于分类器而言,如果分类器不加思考,对每一个测试样例的类别都划分为0,达到99%的正确率,但是,问题来了,如果真的发生地震时,这个分类器毫无察觉,那带来的后果将是巨大的。很显然,99%正确率的分类器并不是我们想要的。出现这种现象的原因主要是数据分布不均衡,类别为1的数据太少,错分了类别1但达到了很高的正确率缺忽视了研究者本身最为关注的情况。

相关推荐
少许极端8 分钟前
算法奇妙屋(五)-链表
数据结构·算法·链表
ARM+FPGA+AI工业主板定制专家12 分钟前
基于Jetson+FPGA+GMSL+AI的自动驾驶数据采集解决方案
人工智能·机器学习·自动驾驶
二进制_博客21 分钟前
spark on hive 还是 hive on spark?
大数据·hive·spark
XISHI_TIANLAN24 分钟前
【多模态学习】Q&A6: 什么是MOE架构?Router Z Loss函数是指什么?负载均衡损失(Load Balancing Loss)又是什么?
学习·算法·语言模型
智海观潮34 分钟前
Spark RDD详解 —— RDD特性、lineage、缓存、checkpoint、依赖关系
大数据·缓存·spark
木子.李34736 分钟前
数据结构-算法C++(额外问题汇总)
数据结构·c++·算法
聊聊MES那点事43 分钟前
汽车零部件MES系统实施案例介绍
人工智能·信息可视化·汽车·数据可视化
花心蝴蝶.1 小时前
API签名认证算法全解析
算法
兮山与1 小时前
算法6.0
算法
代码对我眨眼睛1 小时前
739. 每日温度 LeetCode 热题 HOT 100
算法·leetcode