logistic回归详解

为什么不直接统计标签数和预测结果数,计算精度?

因为

  • 存在梯度为0的情况
  • 梯度不连续

为什么叫logistic回归

logistic是因为加了一个sigmoid函数,将输出预测值映射到【0,1】

有时候使用MSE损失函数,拟合

有时候使用cross entropy==》 分类问题

softmax解决多分类问题,让大的概率值更大

交叉熵损失详解 cross entropy

kl散度,两个分布重合的话,kl散度等于0,因为他们很整齐

熵:不确定性,惊喜的衡量度,稳定度

二分类的公式推导

cross entropy 越小越好,优化起来速度更快,在pytorch中,把softmax和log打包到一起了

pytorch中的inplace会改变输入x的值

feature缩放

有两种方式

  1. 图像数据增强
python 复制代码
# 对3通道进行归一化处理   imagenet数据集上的
transforms.Normalize(mean=[0.485,0.456,0.406],
                     std=[0.229,0.224,0.225])
python 复制代码
 #  批归一化 最后生成通道数      28*28
x = torch.rand(100,16,784)
layer = nn.BatchNorm1d(16)
out = layer(x)

#[16]   均值
print(layer.running_mean,layer.running_mean.size())

# 方差
print(layer.running_var)
  1. 批归一化
相关推荐
编码小哥6 分钟前
OpenCV背景减法:视频中的运动物体检测
人工智能·opencv·音视频
AI殉道师6 分钟前
Vercel 重磅发布 agent-browser:AI Agent 浏览器自动化的新纪元来了
运维·人工智能·自动化
m0_5649149212 分钟前
Deepseek论文深度解读--“条件记忆”模块(Engram):查算分离开启LLM双稀疏轴时代
人工智能
Oculus Reparo!16 分钟前
书生大模型强化学习 RL 实践(Internlm2.5-1.8B swift GRPO gsm8k)
人工智能
StarChainTech16 分钟前
无人机租赁平台:开启智能租赁新时代
大数据·人工智能·微信小程序·小程序·无人机·软件需求
Quintus五等升17 分钟前
深度学习②|实现人数回归预测
人工智能·深度学习·学习·机器学习·回归
可乐要加冰^-^18 分钟前
RL for LLM(large language model)
人工智能·语言模型·自然语言处理
大模型最新论文速读32 分钟前
ProFit: 屏蔽低概率 token,解决 SFT 过拟合问题
人工智能·深度学习·机器学习·语言模型·自然语言处理
cskywit38 分钟前
VMamba环境本地适配配置
人工智能·深度学习·mamba
victory043139 分钟前
minimind SFT失败原因排查和解决办法
人工智能·python·深度学习