如何理解深度学习的训练过程

文章目录

1.训练是干什么?

以yolov5为例子,训练的目的是把一组输入猫狗图像放到神经网络中,得到一个输出模型,这个模型下次可以直接用来识别哪个是猫,哪个是狗

2.预训练模型进行训练,主要更改的是预训练模型的什么东西?

  • 超参数(Hyperparameters):

这是模型结构中定义的参数,比如:

卷积核大小(kernel_size):影响特征提取的精细程度。

步长(stride):决定卷积操作在输入特征图上的移动幅度,影响输出的特征图大小。

激活函数(如SiLU):影响非线性变换的方式。

层数、通道数(如卷积核数量、隐藏层数量):影响模型的复杂度。

调整这些超参数不涉及对模型本身权重的学习,而是你手动设计模型结构的过程。你可以手动设置这些参数,优化模型的表现。

  • 模型参数(Trainable Parameters):

这是模型在训练过程中通过数据自动学习的参数,主要是卷积层的权重和偏置。比如卷积核内部的权重(Conv2d中的weights和bias)会随着训练数据的输入和误差的反馈不断更新。

这些参数是在反向传播过程中由优化器(如Adam、SGD等)自动调整的,目的是使模型更好地拟合训练数据。(这里的weights和bias是隐含的,不会出现在打印出的网络结构中)

相关推荐
tang7778912 分钟前
Python爬虫代理,选短效IP还是长效IP?
爬虫·python·tcp/ip
怪我冷i13 分钟前
Zed编辑器安装与使用Agent Servers(腾讯CodeBuddy、阿里百炼Qwen Code、DeepSeek Cli)
人工智能·编辑器·ai编程·ai写作·zed
AI_Auto26 分钟前
智能制造-AI质检六大场景
人工智能·制造
写文章的大米27 分钟前
这份数据验证方案,可以让你的 FastAPI 崩溃率直降90%
python
xingzhemengyou131 分钟前
Python 有哪些定时器
前端·python
站大爷IP40 分钟前
Python自动整理音乐文件:按艺术家和专辑分类歌曲
python
BBB努力学习程序设计41 分钟前
Python 高效处理大数据:生成器(Generator)的工作机制与实战技巧
python
特立独行的猫a1 小时前
AI工具推荐:Google 神秘武器 CodeWiki ---上古项目的终极克星
人工智能
nn在炼金1 小时前
大模型领域负载均衡技术
人工智能·算法·负载均衡
久菜盒子工作室1 小时前
【A股复盘】2025.12.30
人工智能·经验分享·金融