PyTorch逻辑回归总结

Steve lu2025-04-16 19:29

目录

PyTorch逻辑回归总结

PyTorch逻辑回归总结

神经网络基础

基本结构

输入节点
隐藏节点
输出节点

学习路径

逻辑回归作为神经网络入门基础

线性回归

简单线性回归

模型表达式： y = β 0 + β 1 x + ϵ y = \beta_0 + \beta_1 x + \epsilon y=β0+β1x+ϵ
参数估计方法：最小二乘法
参数求解公式
- β ^ 1 = ∑ ( x i − x ˉ ) ( y i − y ˉ ) ∑ ( x i − x ˉ ) 2 \hat{\beta}_1 = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sum (x_i - \bar{x})^2} β^1=∑(xi−xˉ)2∑(xi−xˉ)(yi−yˉ)
- β ^ 0 = y ˉ − β ^ 1 x ˉ \hat{\beta}_0 = \bar{y} - \hat{\beta}_1 \bar{x} β^0=yˉ−β^1xˉ

多元线性回归

模型表达式： y = β 0 + β 1 x 1 + ⋯ + β p x p + ϵ y = \beta_0 + \beta_1 x_1 + \cdots + \beta_p x_p + \epsilon y=β0+β1x1+⋯+βpxp+ϵ
矩阵形式求解： β ^ = ( X T X ) − 1 X T y \hat{\beta} = (X^T X)^{-1} X^T y β^=(XTX)−1XTy

逻辑回归

核心原理

线性回归结果映射到概率： z = θ T x z = \theta^T x z=θTx
Sigmoid函数： σ ( z ) = 1 1 + e − z \sigma(z) = \frac{1}{1 + e^{-z}} σ(z)=1+e−z1
- 输出范围： $0, 1$
- 代码实现：sigmoid(z)

损失函数

最大似然估计推导
对数损失函数：
J ( θ ) = − ∑ $y log ⁡ ( y \^ ) + ( 1 − y ) log ⁡ ( 1 − y \^ )$ J(\theta) = -\sum \left $y \\log(\\hat{y}) + (1 - y) \\log(1 - \\hat{y}) \\right$ J(θ)=−∑ $ylog(y\^)+(1−y)log(1−y\^)$
防止数值溢出：添加极小值 ϵ \epsilon ϵ

梯度下降法

基本思想

类比下山问题
梯度方向：函数下降最快的方向
学习率（η）：控制步长的超参数

关键公式

参数更新： θ n + 1 = θ n − η ∂ J ∂ θ \theta_{n+1} = \theta_n - \eta \frac{\partial J}{\partial \theta} θn+1=θn−η∂θ∂J
偏导数计算：
- 权重： ∂ J ∂ θ j = 1 m ∑ ( y i − y ^ i ) x i j \frac{\partial J}{\partial \theta_j} = \frac{1}{m} \sum (y_i - \hat{y}i) x{ij} ∂θj∂J=m1∑(yi−y^i)xij
- 截距： ∂ J ∂ b = 1 m ∑ ( y i − y ^ i ) \frac{\partial J}{\partial b} = \frac{1}{m} \sum (y_i - \hat{y}_i) ∂b∂J=m1∑(yi−y^i)

学习率影响

过小：收敛缓慢
过大：震荡或发散
优化策略：动态衰减、网格搜索

PyTorch实现

数据准备

使用make_classification生成数据
拆分训练集/测试集：train_test_split

模型构建

参数初始化
- 权重：w = torch.randn(1, 10, requires_grad=True)
- 偏置：b = torch.randn(1, requires_grad=True)
前向传播
- 线性运算：z = torch.mm(x, w.T) + b
- Sigmoid激活：y_hat = torch.sigmoid(z)
损失计算
- 二元交叉熵：loss = F.binary_cross_entropy(y_hat, y_true)
反向传播
- 自动求导：loss.backward()
- 梯度清零：w.grad.zero_()
参数更新
- w -= lr * w.grad
- b -= lr * b.grad

代码优化

对比NumPy与PyTorch实现
利用自动求导简化梯度计算

核心概念对比

概率 vs 似然
- 概率：已知参数预测结果
- 似然：已知结果估计参数
超参数 vs 权重参数
- 超参数：手动设置（如学习率）
- 权重参数：模型自动学习

上一篇：正则表达式反向引用的综合应用魔法：从重复文本到简洁表达的蜕变

下一篇：又一个跨端框架——万字长文解析 ReactLynx 实现原理

热门推荐

01GitHub 镜像站点 022026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 03AI科技热点日报 | 2026年07月01日 04幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 05GPT-5.5 对比 GPT-5.6 Sol、Terra、Luna：官方性能数据与选型分析 062026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 08国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）09几个好用的ip纯净度检测网站 102026 年 AI 大模型 & AI 编程工具实战全总结