【machine learning-17-分类(逻辑回归sigmod)】

分类问题

先说一下什么是分类问题,举个例子:

判定一封邮件是否是垃圾邮件;

判定图片是不是一直猫;

等等

这些问题的答案都是有限的,而不像是线性回归,是存在无限可能的不确定值。

这种问题就是分类问题,那么线性回归可以解决分类问题么?

答案是可以,但是效果可能不太好

线性回归解决分类问题的弊端

比如上面是检测肿瘤是否良性的一个数据集,有蓝色和红色这两种数据,分别表示不同的结果,是或者不是(0或者1标识),如果线性回归来拟合这个数据的话,可能用图中那条蓝色直线来表示,然后我们定一个阈值,比如y轴0.5以上的就表示非良性,那么这时候x轴位置的点就表示临界点了。输入在X左边的为0,否则为1。现在看起来是没问题的。但是如果数据集增加一个下图中的数据呢?

那样拟合的直线就应该像图中绿色这条线,这时候如果阈值还是0.5,然后就会发现水平轴的临界值就变了,这时候这条直线x轴这个临界点左边这两个红色数据跟右边的两个红色数据已经不是同一种类了。

显然这个结果不是我们想要的。

怎么解决这个问题,就是逻辑回归,虽然也是回归,但其实跟线性回归没关系,不要误解,这其实是一个二分类算法。

sigmod 逻辑回归

sigmod 函数如下:

它的函数图像如下

注意观察下,这个函数值总是在0和1之间,正好与二分类的算法要求输出0和1的结果相对应,二分类的算法是在线性回归基础上再加上一个sigmode,如下:

python 复制代码
sigmod(f(x))

至于深层次的详细解读会在下一节中介绍

相关推荐
新兴ICT项目支撑1 小时前
BERT文本分类超参数优化实战:从13小时到83秒的性能飞跃
人工智能·分类·bert
递归不收敛1 小时前
吴恩达机器学习课程(PyTorch适配)学习笔记:1.3 特征工程与模型优化
pytorch·学习·机器学习
B站_计算机毕业设计之家3 小时前
机器学习实战项目:Python+Flask 汽车销量分析可视化系统(requests爬车主之家+可视化 源码+文档)✅
人工智能·python·机器学习·数据分析·flask·汽车·可视化
lucky_syq6 小时前
解锁特征工程:机器学习的秘密武器
人工智能·机器学习
CM莫问6 小时前
推荐算法之粗排
深度学习·算法·机器学习·数据挖掘·排序算法·推荐算法·粗排
rengang666 小时前
10-支持向量机(SVM):讲解基于最大间隔原则的分类算法
人工智能·算法·机器学习·支持向量机
周杰伦_Jay7 小时前
【Git操作详解】Git进行版本控制与管理,包括分支,提交,合并,标签、远程仓库查看
大数据·ide·git·科技·分类·github
on_pluto_8 小时前
LLaMA: Open and Efficient Foundation Language Models 论文阅读
python·机器学习
antonytyler9 小时前
认识机器学习
机器学习
一车小面包9 小时前
对注意力机制的直观理解
人工智能·深度学习·机器学习