分类问题的评价指标

一、logistic regression

logistic regression也叫做对数几率回归。虽然名字是回归,但是不同于linear regression,logistic regression是一种分类学习方法。

同时在深度神经网络中,有一种线性层的输出也叫做logistic,他是被输入到激活函数中的输入如下图所示。

Softmax和sigmoid的输出不同,sigmoid输出的是每一个种类成为

二、分类算法的评价指标 <分类算法评价指标详解 - 知乎>

首先,机器学习分类任务的常用评价指标:混淆矩阵(Confuse Matrix)、准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1 Score、P-R曲线(Precision-Recall Curve)、ROC、AUC。

混淆矩阵:每行显示样本预测到的值,列显示标签的值。针对一个二分类问题,可以将其分为四种

TP:True Positive 表示真的正类

TN:True Negative 真的负类

FP:False Positive 假的正类

FN:False Negative 假的负类 这些都可以从混淆矩阵中得出。

1.准确率 Accuracy

Acc=(TP+TN)/(TP+TN+FP+FN)

预测结果中的所有预测争取的类别比左右的预测结果。即混淆矩阵对角元素和所有元素的比值。

准确率有一个缺点,就是数据的样本不均衡,这个指标是不能评价模型的性能优劣的。

假如一个测试集有正样本99个,负样本1个。模型把所有的样本都预测为正样本,那么模型的Accuracy为99%,看评价指标,模型的效果很好,但实际上模型没有任何预测能力。

2.精确度precision

在模型预测为正样本的结果中,真正是正样本所占的百分比,具体公式如下:

Pre = TP / (TP+TF)

在预测为正样本的结果中,真的正样品的占比。

3.召回率recall

在实际正样本中,预测为真的正样本占所有正样本的比值

Recall= TP / (TP+TN)

4.F1 sore

Recall和precision之间会有一个此消彼长的关系,如果要兼顾二者,就需要F1 Score,F1 Score是一种调和平均数。

F1 Score = (2*Pre*Recall)/ (Pre+Recall)

同时还有一种,P-R曲线(precision -Recall)描述精确率和召回率变化。

模型与坐标轴围成的面积越大,则模型的性能越好。但一般来说,曲线下的面积是很难进行估算的,所以衍生出了"平衡点"(Break-Event Point,简称BEP),即当P=R时的取值,平衡点的取值越高,性能更优。

线性回归模型和logistic回归模型

相关推荐
FluxMelodySun14 分钟前
机器学习(三十三) 概率图模型与隐马尔可夫模型
人工智能·机器学习
V搜xhliang024623 分钟前
OpenClaw、AI大模型赋能数据分析与学术科研 学习
人工智能·深度学习·学习·机器学习·数据挖掘·数据分析
AI医影跨模态组学31 分钟前
云南省肿瘤医院李振辉&广东省人民医院等团队:免疫表型引导的可解释放射组学模型预测III–IV期d-MMR/MSI-H结直肠癌新辅助抗PD-1治疗反应
人工智能·深度学习·论文·医学·医学影像
Luca_kill1 小时前
实战指南:用 Python + NLP 搭建一套轻量级 AI 舆情监控系统
人工智能·python·机器学习·nlp·舆情监控
自由的风.2 小时前
【无标题】
人工智能·机器学习·自然语言处理
逻辑驱动的ken2 小时前
Java高频面试考点场景题05
java·开发语言·深度学习·求职招聘·春招
AI医影跨模态组学2 小时前
NPJ Precis Oncol 安徽医科大学第一附属医院超声科张超学等团队:多模态深度学习方法用于R0切除卵巢癌的生存预测与风险分层
人工智能·深度学习·论文·医学·医学影像
云和数据.ChenGuang2 小时前
机器学习之超参数是什么?
人工智能·深度学习·神经网络·目标检测·机器学习·自然语言处理·语音识别
纤纡.2 小时前
基于 PyQt5 的桌面应用开发实战:登录、预测、计算器、摄像头多功能系统
开发语言·人工智能·qt·计算机视觉
AI周红伟2 小时前
周红伟:梁文峰DeepSeek V4 终极对决 GPT-6,梁文锋透露 DeepSeek V4 将于 4 月下旬发布
人工智能·gpt·深度学习·微信·自然语言处理·openclaw