深度学习:day03-04

前言:学习内容来自Day03-08.激活函数介绍_哔哩哔哩_bilibili

一,激活函数:

给网络注入非线性因素。

Sigmoid/Tanh/Relu/Softmax

二,参数初始化:

最常见三种:

1.全0:nn.init.zeros()

2.kaiming:

1)kaiming正态:nn.kaiming.normal()

2)kaiming随机:nn.kaiming.uniform()

3.xavier:

1)xavier正态:nn.xavier.normal()

2)xavier随机:nn.xavier.uniform()

神经网络的构建:

1.定义类继承(nn.module)

2.使用魔法函数__init__(self)实现初始化

2.1初始化父类super().init()

2.2初始化神经元

3.前向传播

三,激活函数

1.多分类交叉熵损失函数

2.二分类任务损失函数

3.L1loss

问题:0点不可导

4.MSE函数

使用欧氏距离公式,目的是解决L1函数在0点不可导的问题。问题:梯度爆炸

  1. SmoothL1Loss函数

效果最好,使用分段函数。

四,梯度下降参数

1.epoch:轮数

2.batch:每轮训练多少数据

3.iteration:迭代次数

相关推荐
phoenix@Capricornus3 分钟前
CNN中卷积输出尺寸的计算
人工智能·神经网络·cnn
创客匠人老蒋4 分钟前
从数据库到智能体:教育企业如何构建自己的“数字大脑”?
大数据·人工智能·创客匠人
GJGCY7 分钟前
技术解析|中国智能体4类路径深度拆解,这类底座架构优势凸显
人工智能·经验分享·ai·agent·智能体·数字员工
犀思云8 分钟前
如何通过网络即服务平台实现企业数字化转型?
运维·网络·人工智能·系统架构·机器人
FIT2CLOUD飞致云26 分钟前
学习笔记丨MaxKB Office Word AI翻译加载项的实现
人工智能·ai·开源·智能体·maxkb
机器视觉的发动机33 分钟前
从实验室到工业现场:机器人视觉感知系统的边缘AI架构实战, 深度解析硬件选型、TensorRT量化加速与多传感器融合的极致优化方案
人工智能·机器人·视觉检测·人机交互·机器视觉
雾削木40 分钟前
AI文献提示词prompts
人工智能
~kiss~1 小时前
大模型中激活函数、前馈神经网络 (FFN) 的本质
人工智能·深度学习·神经网络
老兵发新帖1 小时前
推理平台ONNX性能对比PyTorch原生格式
人工智能
犀思云1 小时前
企业端到端NaaS连接的优势与应用
网络·人工智能·机器人·智能仓储·专线