对数几率回归

对数几率回归简介

对数几率回归(Logistic Regression)是一种用于解决分类问题的经典统计模型,其核心思想是利用逻辑函数(Sigmoid函数)将线性回归模型的输出值映射到概率范围 [0, 1],从而实现分类预测。对数几率回归特别适合用于二分类问题。

模型表达式

对数几率回归的概率预测公式为:

其中:

  • w为权重向量,x 为输入特征向量,b为偏置项
  • 是 Sigmoid 函数

目标是通过训练确定参数 w 和 b,以最大化模型对数据的预测能力。


极大似然函数与交叉熵损失

极大似然函数

在训练过程中,假设数据集包含 n 个样本​,目标是最大化样本标签 y 的条件概率的乘积,即似然函数:

为简化计算,通常对似然函数取对数,得到对数似然函数:

交叉熵损失

对数似然函数的负值称为交叉熵损失,是对数几率回归优化的目标函数:

通过最小化交叉熵损失函数,可以训练出最优的模型参数。

在信息论中涉及信息熵与交叉熵的概念。信息熵越大,表示随机变量的不确定性越大。相对熵=信息熵+交叉熵,相对熵用来度量两个随机变量之间的差异。


参数优化方法

梯度下降法

使用梯度下降法(Gradient Descent)通过迭代更新参数 w 和 b 来最小化损失函数。更新公式为:

其中 η为学习率。

牛顿法

牛顿法是一种二阶优化方法,利用梯度和二阶导数(Hessian 矩阵)更新参数,相较于梯度下降法收敛更快。更新公式为:

其中:

  • ∇ℓ 是损失函数的梯度
  • H 是 Hessian 矩阵,定义为损失函数的二阶导数矩阵

优点: 牛顿法可以显著加快优化速度,特别是在凸优化问题中表现出色。
缺点: 计算 Hessian 矩阵和求逆的开销较大,不适合大规模数据。

相关推荐
白日做梦Q15 小时前
人脸识别技术演进:从Facenet到ArcFace的精度飞跃
人工智能·深度学习·计算机视觉
柠檬071115 小时前
opencv 未知函数记录-estimateAffinePartial2D
人工智能·opencv·计算机视觉
Python极客之家15 小时前
基于数据挖掘和知识图谱的医疗智能问诊系统
人工智能·python·机器学习·数据挖掘·毕业设计·知识图谱
Watermelo61715 小时前
TOON:一种为大模型设计的JSON压缩型数据结构
数据结构·人工智能·语言模型·自然语言处理·数据挖掘·数据分析·json
模型启动机15 小时前
Google A2UI技术解析:AI Agent如何构建安全且原生的用户界面
人工智能·ai·大模型
小途软件15 小时前
springboot013基于SpringBoot的旅游网站的设计与实现
java·人工智能·pytorch·python·深度学习·语言模型
cute_ming16 小时前
LangGraph入门:LCEL详解
人工智能·机器学习·transformer·知识图谱
草莓熊Lotso17 小时前
Qt 进阶核心:UI 开发 + 项目解析 + 内存管理实战(从 Hello World 到对象树)
运维·开发语言·c++·人工智能·qt·ui·智能手机
Light601 天前
智链全球,韧性履约:AI赋能新一代海外EPC/EPCM项目管理解决方案
人工智能·数字孪生·风险管理·ai赋能·海外epc/epcm·智慧项目管理·协同增效
棒棒的皮皮1 天前
【深度学习】YOLO核心原理介绍
人工智能·深度学习·yolo·计算机视觉