深度学习:day03-04

前言:学习内容来自Day03-08.激活函数介绍_哔哩哔哩_bilibili

一,激活函数:

给网络注入非线性因素。

Sigmoid/Tanh/Relu/Softmax

二,参数初始化:

最常见三种:

1.全0:nn.init.zeros()

2.kaiming:

1)kaiming正态:nn.kaiming.normal()

2)kaiming随机:nn.kaiming.uniform()

3.xavier:

1)xavier正态:nn.xavier.normal()

2)xavier随机:nn.xavier.uniform()

神经网络的构建:

1.定义类继承(nn.module)

2.使用魔法函数__init__(self)实现初始化

2.1初始化父类super().init()

2.2初始化神经元

3.前向传播

三,激活函数

1.多分类交叉熵损失函数

2.二分类任务损失函数

3.L1loss

问题:0点不可导

4.MSE函数

使用欧氏距离公式,目的是解决L1函数在0点不可导的问题。问题:梯度爆炸

  1. SmoothL1Loss函数

效果最好,使用分段函数。

四,梯度下降参数

1.epoch:轮数

2.batch:每轮训练多少数据

3.iteration:迭代次数

相关推荐
happyprince1 小时前
2026年04月12日热门Model/github项目
人工智能
网教盟人才服务平台1 小时前
AI 全面重塑网络攻防生态,智能安全进入深度对抗时代
网络·人工智能·安全
w_t_y_y1 小时前
python类库(二)输出解析
人工智能
sinat_286945191 小时前
AI Coding 时代的 TDD:从理念到工程落地
人工智能·深度学习·算法·tdd
ASKED_20191 小时前
从排序到生成:腾讯广告算法大赛 2025 baseline解读
人工智能·算法
阿杰学AI1 小时前
AI核心知识115—大语言模型之 自监督学习(简洁且通俗易懂版)
人工智能·学习·ai·语言模型·aigc·监督学习·自监督学习
IT_陈寒2 小时前
为什么我的JavaScript异步回调总是乱序执行?
前端·人工智能·后端
Zzj_tju2 小时前
大语言模型技术指南:Transformer 为什么能成为基础架构?核心模块与参数怎么理解
人工智能·语言模型·transformer
gorgeous(๑>؂<๑)2 小时前
【CVPR26-韩国科学技术院】令牌扭曲技术助力多模态大语言模型从邻近视角观察场景
人工智能·语言模型·自然语言处理
AC赳赳老秦2 小时前
OpenClaw email技能:批量发送邮件、自动回复,高效处理工作邮件
运维·人工智能·python·django·自动化·deepseek·openclaw