机器学习 | 逻辑回归 | 尚硅谷学习

5.1 逻辑回归简介

逻辑回归(Logistic Regression)是一种广义线性模型,主要用于处理分类问题。它通过对特征进行线性组合,然后通过Sigmoid函数将结果映射到(0,1)区间,以此来预测样本属于某个类别的概率。逻辑回归模型不仅能够预测分类结果,还能给出属于某一类别的概率估计。

损失函数

逻辑回归通常使用交叉熵(Cross Entropy)作为损失函数,它能够衡量模型预测概率分布与真实概率分布之间的差异。交叉熵损失函数的形式如下:

其中,m是样本数量,y_i是样本的真实标签,h_theta(x_i)是模型对第i个样本的预测概率。

参数优化

逻辑回归模型的参数通过最大似然估计(MLE)进行优化,通常使用梯度下降法来最小化损失函数,从而求解模型参数。

逻辑回归的优缺点

优点:

模型简单:逻辑回归模型形式简单,易于理解和实现。

输出概率:能够给出样本属于某一类别的概率估计。

凸函数优化:损失函数是凸函数,易于求解全局最优解。

泛化能力:逻辑回归对小噪声的鲁棒性较好,不易过拟合。

缺点:

表达能力有限:逻辑回归是线性模型,对于非线性问题需要进行特征工程。

特征处理:需要对连续特征进行离散化,以增强模型的表达能力。

高维稀疏数据:在高维稀疏数据下,逻辑回归的性能可能不佳。

应用场景

逻辑回归广泛应用于各种二分类问题,如垃圾邮件检测、疾病诊断、金融欺诈预测等。它也可以通过一对多(One-vs-Rest)或多项逻辑回归(Multinomial Logistic Regression)的方式来处理多分类问题。

5.1.1 什么是逻辑回归

5.1.2 逻辑回归应用场景

5.1.3 逻辑回归损失函数

5.1.4 损失函数的梯度

5.1.5 API的使用

5.2 多任务分类

5.2.1 一对多(OVR)

5.2.2 Softmax 回归 (多项逻辑回归)

5.3 手写数字识别

5.3.1 数据集说明

5.3.2 逻辑回归实现手写数字识别


相关推荐
zhangfeng11331 小时前
google gmini大语言模型 的数据预训练 flan等方法 介绍下
人工智能·transformer
z落落1 小时前
C# 接口 interface (多接口实现、类+接口、成员重名)
java·开发语言
用户5191495848451 小时前
WordPress File Upload 插件路径遍历漏洞利用工具 (CVE-2024-9047)
人工智能·aigc
发际线向北1 小时前
0x05 深入了解JVM虚拟机(JVM方法调用 -Ⅰ)
java
MartinYeung52 小时前
[论文学习]基于梯度迭代上下文优化的 LLM 隐私越狱攻击框架
学习·区块链
宋哥转AI2 小时前
学了Spring AI Graph再看LangGraph,发现API几乎一模一样
java·人工智能·agent
Z-D-K2 小时前
考验AI的“自我和意识“-AI对《红楼梦》后40回的改写(16)
人工智能·ai·aigc·交互·agi
AI破壁猿2 小时前
我做了一个 AI 工具,把 GitHub 仓库 5 分钟转成专利交底书
人工智能·llm·saas
升鲜宝供应链及收银系统源代码服务2 小时前
升鲜宝 AI助手模块功能关联、调用关系与软件开发说明(二)---升鲜宝生鲜配送供应链管理系统源代码服务
人工智能·生鲜配送系统·生鲜供应链源代码·供应链源代码出售·生鲜配送源代码服务·猪肉生产加工系统源代码·生鲜供应链系统
张高兴2 小时前
张高兴的 Hailo-10 开发指南:(二)使用 LangChain 搭建本地大模型 RAG 问答应用
python·边缘计算·hailo