logistic回归详解

为什么不直接统计标签数和预测结果数,计算精度?

因为

  • 存在梯度为0的情况
  • 梯度不连续

为什么叫logistic回归

logistic是因为加了一个sigmoid函数,将输出预测值映射到【0,1】

有时候使用MSE损失函数,拟合

有时候使用cross entropy==》 分类问题

softmax解决多分类问题,让大的概率值更大

交叉熵损失详解 cross entropy

kl散度,两个分布重合的话,kl散度等于0,因为他们很整齐

熵:不确定性,惊喜的衡量度,稳定度

二分类的公式推导

cross entropy 越小越好,优化起来速度更快,在pytorch中,把softmax和log打包到一起了

pytorch中的inplace会改变输入x的值

feature缩放

有两种方式

  1. 图像数据增强
python 复制代码
# 对3通道进行归一化处理   imagenet数据集上的
transforms.Normalize(mean=[0.485,0.456,0.406],
                     std=[0.229,0.224,0.225])
python 复制代码
 #  批归一化 最后生成通道数      28*28
x = torch.rand(100,16,784)
layer = nn.BatchNorm1d(16)
out = layer(x)

#[16]   均值
print(layer.running_mean,layer.running_mean.size())

# 方差
print(layer.running_var)
  1. 批归一化
相关推荐
Python大数据分析@3 分钟前
如何用Deepseek制作流程图?
人工智能·流程图·ai编程
爱在有苏32 分钟前
ollama离线部署qwq模型实操指南
人工智能
机器之心36 分钟前
ICLR 2025 Spotlight | 慕尼黑工业大学&北京大学:迈向无冲突训练的ConFIG方法
人工智能
程序员JerrySUN37 分钟前
在树莓派上运行 COCO-SSD MobileNet 目标检测:完整指南
人工智能·目标检测·计算机视觉
新智元42 分钟前
谷歌重磅推出全新 Scaling Law,抢救 Transformer!3 万亿美元 AI 面临岔路
人工智能·openai
九鼎创展科技43 分钟前
LGA封装 Z3588开发板,8K视频编解码
arm开发·人工智能·嵌入式硬件
moreface44 分钟前
uni.request 配置流式接收+通义千问实现多轮对话
前端·vue.js·人工智能
Jackson@ML1 小时前
一分钟了解深度学习
人工智能·深度学习·deep learning
神经星星1 小时前
入选ICLR 2025!剑桥大学提出Celcomen模型,首次在空间转录组学分析中实现因果推断可识别性
人工智能·深度学习·机器学习
数字供应链安全产品选型1 小时前
2025移动端软件供应链安全开源治理方案最佳实践
网络·人工智能·安全·开源·开源软件