深度学习:day03-04

前言:学习内容来自Day03-08.激活函数介绍_哔哩哔哩_bilibili

一,激活函数:

给网络注入非线性因素。

Sigmoid/Tanh/Relu/Softmax

二,参数初始化:

最常见三种:

1.全0:nn.init.zeros()

2.kaiming:

1)kaiming正态:nn.kaiming.normal()

2)kaiming随机:nn.kaiming.uniform()

3.xavier:

1)xavier正态:nn.xavier.normal()

2)xavier随机:nn.xavier.uniform()

神经网络的构建:

1.定义类继承(nn.module)

2.使用魔法函数__init__(self)实现初始化

2.1初始化父类super().init()

2.2初始化神经元

3.前向传播

三,激活函数

1.多分类交叉熵损失函数

2.二分类任务损失函数

3.L1loss

问题:0点不可导

4.MSE函数

使用欧氏距离公式,目的是解决L1函数在0点不可导的问题。问题:梯度爆炸

  1. SmoothL1Loss函数

效果最好,使用分段函数。

四,梯度下降参数

1.epoch:轮数

2.batch:每轮训练多少数据

3.iteration:迭代次数

相关推荐
刘~浪地球2 分钟前
DeepSeek V3 vs GPT-4 深度对比测评:国产大模型能否一战?
人工智能
IT_陈寒6 分钟前
JavaScript的异步地狱,我差点没爬出来
前端·人工智能·后端
AI木马人9 分钟前
20.人工智能实战:大模型项目如何从 Demo 走向生产?一套可落地的上线验收清单与工程治理方案
java·开发语言·人工智能
湘-枫叶情缘13 分钟前
穿透范畴的迷雾:从“四范式”到AI问题建模的现代认知框架
人工智能
@不误正业14 分钟前
OpenHarmony-A2A协议实战-多智能体跨应用协同架构与实现
人工智能·架构·harmonyos·开源鸿蒙
前端.火鸡15 分钟前
如何使用本地显卡算力给AI赋能(文生图、图生图等)分币不要、无限次数
人工智能
cyyt16 分钟前
深度学习周报(4.27~5.3)
人工智能·深度学习
圣殿骑士-Khtangc17 分钟前
大模型长任务自动化的迷思——信息熵定律的视角
人工智能
帅气的钟先生18 分钟前
OpenClaw + QQBot 实战:从 0 到 1 搭建你的消息自动化助手
运维·人工智能·自动化
王莎莎-MinerU24 分钟前
从 PDF 到知识资产:MinerU 文档解析如何成为企业 RAG 系统的“数据基石”
大数据·人工智能·pdf·个人开发