如何理解深度学习的训练过程

文章目录

1.训练是干什么?

以yolov5为例子,训练的目的是把一组输入猫狗图像放到神经网络中,得到一个输出模型,这个模型下次可以直接用来识别哪个是猫,哪个是狗

2.预训练模型进行训练,主要更改的是预训练模型的什么东西?

  • 超参数(Hyperparameters):

这是模型结构中定义的参数,比如:

卷积核大小(kernel_size):影响特征提取的精细程度。

步长(stride):决定卷积操作在输入特征图上的移动幅度,影响输出的特征图大小。

激活函数(如SiLU):影响非线性变换的方式。

层数、通道数(如卷积核数量、隐藏层数量):影响模型的复杂度。

调整这些超参数不涉及对模型本身权重的学习,而是你手动设计模型结构的过程。你可以手动设置这些参数,优化模型的表现。

  • 模型参数(Trainable Parameters):

这是模型在训练过程中通过数据自动学习的参数,主要是卷积层的权重和偏置。比如卷积核内部的权重(Conv2d中的weights和bias)会随着训练数据的输入和误差的反馈不断更新。

这些参数是在反向传播过程中由优化器(如Adam、SGD等)自动调整的,目的是使模型更好地拟合训练数据。(这里的weights和bias是隐含的,不会出现在打印出的网络结构中)

相关推荐
纤纡.13 分钟前
OpenCV 实战:基于 Haar 特征的人脸与微笑检测全解析
人工智能·opencv·计算机视觉
百胜软件@百胜软件13 分钟前
百胜软件黄飞出席时尚产业生态圈主题沙龙,分享AI在时尚零售企业的应用实践
人工智能·零售
华科大胡子17 分钟前
Chrome安全机制深度解析
python
云边云科技_云网融合18 分钟前
基于深度学习的设备监控技术:从被动报警到主动预警的革新
网络·人工智能·云计算
易标AI22 分钟前
标书智能体(四)——提示词顺序优化,让缓存命中,输入成本直降10倍
人工智能·python·提示词·智能体·招投标
ai产品老杨24 分钟前
异构计算新范式:基于 X86/ARM 的 AI 视频管理平台架构深度解析
arm开发·人工智能·架构
深耕AI26 分钟前
【VS Code 中 Python 虚拟环境降级完整指南(含 uv 工具实战)】
开发语言·python·uv
jkyy201431 分钟前
零售保健品如何实现健康全周期管理?会员营销推荐系统提升复购率
人工智能
→长歌1 小时前
2026Java面试30题精解
java·python·面试
Bert.Cai1 小时前
pymysql自动提交设置
开发语言·python