机器学习笔记:初始化0的问题

1 前言

假设我们有这样的两个模型:

  • 第一个是逻辑回归
  • 第二个是神经网络

他们的损失函数都是交叉熵

sigmoid函数的导数:

他们能不能用0初始化呢?

2 逻辑回归

2.1 求偏导

2.1.1 结论

2.1.2 L对a的偏导

2.1.3 对w1,w2求偏导

w2同理

2.1.4 对b偏导

2.2 参数更新与分析

w1,w2,b的梯度和w1,w2,b无关,所以初始化成0之后没有影响

3 神经网络

3.1 偏导

a3的部分和前面逻辑回归是一样的

3.1.1 a1部分推导

3.1.1.1 对a1的偏导

3.1.1.2 对w11,w21,b1的推导

3.2 初始化为0

3.2.1 w初始化为0,b初始化为0

3.2.2w初始化为0,b随机初始化

3.3 w随机初始化,b初始化为0

前向传播过程中,a1,a2均不为0,反向传播的过程中各参数均可以更新

更新幅度也不一样

参考内容:神经网络权重为什么不能初始化为0? (qq.com)

相关推荐
星星20253 小时前
VSCode插件精选:4款高效UML绘图工具
笔记
lkbhua莱克瓦247 小时前
Java基础——方法
java·开发语言·笔记·github·学习方法
p66666666688 小时前
STM32-bootloader引导程序跳转机制笔记
笔记·stm32·嵌入式硬件
智者知已应修善业9 小时前
【c语言蓝桥杯计算卡片题】2023-2-12
c语言·c++·经验分享·笔记·算法·蓝桥杯
Elias不吃糖11 小时前
NebulaChat项目构建笔记
linux·c++·笔记·多线程
d111111111d11 小时前
STM32外设学习-串口数据包笔记-(程序)
笔记·stm32·单片机·嵌入式硬件·学习
弘毅 失败的 mian11 小时前
编译和链接
c语言·经验分享·笔记·编程入门
aramae13 小时前
MySQL数据库入门指南
android·数据库·经验分享·笔记·mysql
chenzhou__13 小时前
LinuxC语言文件i/o笔记(第十七天)
linux·c语言·笔记·学习
chenzhou__13 小时前
LinuxC语言文件i/o笔记(第十八天)
linux·c语言·笔记·学习