分类任务的基础学习

1.什么是分类?


2.局限性:

样本量逐渐变大 的时候,准确率会下降 ------>因为线性回归曲线距离我们的原点越远 ,预测就会开始不准确,因为 x前面的倍数就会越来越小 ,这就导致了样本量变大 ,但是那些原来靠近原点的点的结果就会可能发生改变;

3.逻辑回归模型

**和线性回归的区别就是:**方程不一样。

**效果:**能够很好地拟合数据,完成分类任务。
目的:根据数据特征和属性,计算归属于某一类别的概率P(x),根据其概率数值判断其所属类别(应用场景为二分类问题)

3.1数学表达式:

4. 逻辑回归处理分类任务:

将x=-10和x=100带入P(x)sigmod 方程,根据是否大于0.5进行具体判断

5.多因子情况的分类任务考虑:

分类任务 需要考虑两个最重要的大点,第一点是概率分布函数,第二点是g(x)这个关系函数

5.1复杂分类任务的求解:

1.首先明确最小损失函数:

我们首先不再使用线性回归方程的损失函数,因为它需要连续的方程而非离散的点,故求不出极小值点,也就是求不出参数

2.整体样本的损失函数J如下所示:

min(J(θ))

而寻找θ等参数的极值本质还是梯度下降法:
本质:pi+1=pi-αf(pi)对pi求导
迁移:tempθj=θj-α
J(θj)对θj求导

6.区分类散点图:

7.如何利用sklearn得到二分类的边界函数

LogisticRegression:(逻辑回归模型)

7.1如何优化边界函数得到更加优秀的结果:
7.2评估模型的表现:

正确样本数量/总样本数量

相关推荐
Mr数据杨3 分钟前
韩语娱乐新闻评论偏见检测与内容审核优化
机器学习·数据分析·kaggle
克里普crirp29 分钟前
短波通信的可用频率计算方法
人工智能·算法·机器学习
哥布林学者2 小时前
深度学习进阶(九)池化技术的初步改进:RoI Pooling
机器学习·ai
Mr数据杨2 小时前
多标签文本分类实战案例从 Kaggle TechNist 看小样本建模与落地
机器学习·数据分析·kaggle
gjhave2 小时前
强化学习论文(A3C)
人工智能·机器学习
格林威3 小时前
AI视觉检测:Jetson Orin vs RTX A2000 推理速度对比
人工智能·数码相机·机器学习·计算机视觉·视觉检测·机器视觉·工业相机
科研实践课堂(小绿书)4 小时前
基于AI智能算法的装备结构可靠性分析与优化设计技术
人工智能·机器学习
Mr数据杨4 小时前
纽约311工单响应时长预测实战 从结构化回归到城市服务效率分析
机器学习·数据分析·kaggle
Mr数据杨4 小时前
车辆属性多目标预测在定价与能效评估中的应用
机器学习·数据分析·kaggle
renhongxia14 小时前
网络效应与大型语言模型辩论中的协议漂移
大数据·人工智能·机器学习·语言模型·自然语言处理·语音识别·xcode