logistic回归详解

为什么不直接统计标签数和预测结果数,计算精度?

因为

  • 存在梯度为0的情况
  • 梯度不连续

为什么叫logistic回归

logistic是因为加了一个sigmoid函数,将输出预测值映射到【0,1】

有时候使用MSE损失函数,拟合

有时候使用cross entropy==》 分类问题

softmax解决多分类问题,让大的概率值更大

交叉熵损失详解 cross entropy

kl散度,两个分布重合的话,kl散度等于0,因为他们很整齐

熵:不确定性,惊喜的衡量度,稳定度

二分类的公式推导

cross entropy 越小越好,优化起来速度更快,在pytorch中,把softmax和log打包到一起了

pytorch中的inplace会改变输入x的值

feature缩放

有两种方式

  1. 图像数据增强
python 复制代码
# 对3通道进行归一化处理   imagenet数据集上的
transforms.Normalize(mean=[0.485,0.456,0.406],
                     std=[0.229,0.224,0.225])
python 复制代码
 #  批归一化 最后生成通道数      28*28
x = torch.rand(100,16,784)
layer = nn.BatchNorm1d(16)
out = layer(x)

#[16]   均值
print(layer.running_mean,layer.running_mean.size())

# 方差
print(layer.running_var)
  1. 批归一化
相关推荐
TMT星球1 小时前
加速进化发布Booster K1,打造AI时代的苹果公司
人工智能
tangchen。1 小时前
YOLOv4 :兼顾速度与精度!
人工智能·计算机视觉·目标跟踪
郑清1 小时前
Spring AI Alibaba 10分钟快速入门
java·人工智能·后端·ai·1024程序员节·springaialibaba
学术头条1 小时前
用视觉压缩文本!清华、智谱推出Glyph框架:通过视觉-文本压缩扩展上下文窗口
人工智能·深度学习·计算机视觉
Mrliu__2 小时前
Opencv(一): 用Opencv了解图像
人工智能·opencv·计算机视觉
墨香幽梦客3 小时前
掌控制造脉络:电子元器件行业常用ERP系统概览与参考指南
大数据·人工智能
大模型知识营地3 小时前
详解 astream 方法与 stream_mode,构建高级人机交互 Agent
人工智能
QMY5205203 小时前
TikTok 独立 IP 解决方案:独享静态住宅 IP + 环境隔离 + 粘性会话
大数据·jupyter·数据挖掘·数据分析·postman·1024程序员节
知行力4 小时前
百度PaddleOCR-VL:基于0.9B超紧凑视觉语言模型,支持109种语言,性能超越GPT-4o等大模型
人工智能·百度·1024程序员节
deephub4 小时前
vLLM 性能优化实战:批处理、量化与缓存配置方案
人工智能·python·大语言模型·1024程序员节·vllm