机器学习和深度学习-- 李宏毅(笔记与个人理解)Day 14

Day 14 Classfication (short version)

二分类的时候 用sigmoid 那不就是 logistic 回归嘛(softmax 的二分类等价)

Loss

哦 今天刚学的 ,KL散度 ,看来cross-entropy 和KL散度是等价的咯~ 我感觉我的直觉没错
这里MSE离得很远的时候会梯度消失,致使训练变得困难;

tell me WHY?

非线性激活函数:当使用非线性激活函数(如Sigmoid或Tanh)时,在输入值非常大或非常小的情况下,这些激活函数的梯度会接近于零。因此,如果在MSE损失函数的情况下,预测值与目标值之间的差异很大,经过激活函数的反向传播会产生非常小的梯度。

但是Cross Entropy 两个差距很大的时候整体乘积并不会无限大 --- 因为本质上描述的是两个概率分布的差异

相关推荐
三品吉他手会点灯14 分钟前
STM32F103 学习笔记-21-串口通信(第4节)—串口发送和接收代码讲解(上)
笔记·stm32·单片机·嵌入式硬件·学习
XY_墨莲伊19 分钟前
【实战项目】基于B/S结构Flask+Folium技术的出租车轨迹可视化分析系统(文末含完整源代码)
开发语言·后端·python·算法·机器学习·flask
qingwufeiyang_53027 分钟前
Mybatis-plus学习笔记1
笔记·学习·mybatis
hmbbcsm41 分钟前
第一次尝试微调
人工智能·深度学习·机器学习
wayz1143 分钟前
Day 6 编程实战:决策树与过拟合分析
算法·决策树·机器学习
Sophie_U44 分钟前
【Agent开发速成笔记】一、从0到1基础Python学习
笔记·python·学习·agent·智能体
半壶清水1 小时前
[软考网规考点笔记]-局域网之VLAN
网络·笔记·网络协议·tcp/ip
zs宝来了1 小时前
Milvus 向量数据库:HNSW 索引与相似度搜索
机器学习·ai·基础设施
kishu_iOS&AI1 小时前
深度学习 —— Pytorch
人工智能·pytorch·深度学习
数据皮皮侠AI1 小时前
顶刊同款!中国地级市风灾风险与损失数据集(2000-2022)|灾害 / 环境 / 经济研究必备
大数据·人工智能·笔记·能源·1024程序员节