深度学习:day03-04

前言:学习内容来自Day03-08.激活函数介绍_哔哩哔哩_bilibili

一,激活函数:

给网络注入非线性因素。

Sigmoid/Tanh/Relu/Softmax

二,参数初始化:

最常见三种:

1.全0:nn.init.zeros()

2.kaiming:

1)kaiming正态:nn.kaiming.normal()

2)kaiming随机:nn.kaiming.uniform()

3.xavier:

1)xavier正态:nn.xavier.normal()

2)xavier随机:nn.xavier.uniform()

神经网络的构建:

1.定义类继承(nn.module)

2.使用魔法函数__init__(self)实现初始化

2.1初始化父类super().init()

2.2初始化神经元

3.前向传播

三,激活函数

1.多分类交叉熵损失函数

2.二分类任务损失函数

3.L1loss

问题:0点不可导

4.MSE函数

使用欧氏距离公式,目的是解决L1函数在0点不可导的问题。问题:梯度爆炸

  1. SmoothL1Loss函数

效果最好,使用分段函数。

四,梯度下降参数

1.epoch:轮数

2.batch:每轮训练多少数据

3.iteration:迭代次数

相关推荐
33三 三like1 小时前
《基于知识图谱和智能推荐的养老志愿服务系统》开发日志
人工智能·知识图谱
芝士爱知识a2 小时前
【工具推荐】2026公考App横向评测:粉笔、华图与智蛙面试App功能对比
人工智能·软件推荐·ai教育·结构化面试·公考app·智蛙面试app·公考上岸
腾讯云开发者3 小时前
港科大熊辉|AI时代的职场新坐标——为什么你应该去“数据稀疏“的地方?
人工智能
工程师老罗3 小时前
YoloV1数据集格式转换,VOC XML→YOLOv1张量
xml·人工智能·yolo
yLDeveloper3 小时前
从模型评估、梯度难题到科学初始化:一步步解析深度学习的训练问题
深度学习
Coder_Boy_3 小时前
技术让开发更轻松的底层矛盾
java·大数据·数据库·人工智能·深度学习
啊森要自信3 小时前
CANN ops-cv:面向计算机视觉的 AI 硬件端高效算子库核心架构与开发逻辑
人工智能·计算机视觉·架构·cann
2401_836235863 小时前
中安未来SDK15:以AI之眼,解锁企业档案的数字化基因
人工智能·科技·深度学习·ocr·生活
njsgcs3 小时前
llm使用 AgentScope-Tuner 通过 RL 训练 FrozenLake 智能体
人工智能·深度学习