深度学习神经网络的搭建

导数的计算

自动微分

梯度更新

构建神经网络

激活函数

神经网络搭建代码

损失函数

分类任务

多交叉熵损失

损失函数

二分类交叉熵损失

回归任务的损失函数

MAE

MSE

Smooth L1

回归任务损失函数总结

模型训练

梯度下降算法

指数加权平均

β一般设置为:0.9,值越大,当前梯度影响越小,指数加权平均影响越大.

梯度下降优化算法Momentum

梯度下降优化算法AdaGrad

自适应学习率

梯度下降优化算法RMSProp

梯度下降优化算法Adam

梯度下降优化算法总结

深度学习模型训练的思路

相关推荐
夏天的味道٥1 小时前
Spring-AI 多模型接入实战:本地 deepseek + 阿里云百炼 + 硅基流动
人工智能·spring·阿里云
2601_961963381 小时前
从OCR到NLP:AI技术如何赋能电子合同智能审核与风险预警?
网络·人工智能·安全·金融·智能合约
暗夜猎手-大魔王1 小时前
hermes源码学习5-Provider 运行时解析
大数据·人工智能·学习
apcipot_rain1 小时前
计科八股20260611——推荐系统协同过滤、信息安全、团队协作、知识图谱
人工智能·知识图谱
谷哥的小弟1 小时前
大模型核心基础知识(18)—Transformer模型的提出背景
人工智能·深度学习·神经网络·大模型·transformer·大语言模型
CJH(本人账号)1 小时前
大模型的“越狱“之路:从DAN到多模态注入,AI安全边界正在崩塌
网络·人工智能·安全
Chenyu_3101 小时前
世界模型:从“预测下一个状态”到“可交互世界模拟器”
人工智能·计算机视觉·交互
叫我:松哥1 小时前
基于神经网络的汽车与自行车的分类算法设计与实现,采用ResNet50和迁移学习,准确率达到99%
人工智能·python·神经网络·机器学习·分类·汽车·迁移学习
五度易链-区域产业数字化管理平台1 小时前
从编制规范到落地应用,新版可研报告撰写全流程指南
大数据·人工智能