如何理解深度学习的训练过程

文章目录

1.训练是干什么?

以yolov5为例子,训练的目的是把一组输入猫狗图像放到神经网络中,得到一个输出模型,这个模型下次可以直接用来识别哪个是猫,哪个是狗

2.预训练模型进行训练,主要更改的是预训练模型的什么东西?

  • 超参数(Hyperparameters):

这是模型结构中定义的参数,比如:

卷积核大小(kernel_size):影响特征提取的精细程度。

步长(stride):决定卷积操作在输入特征图上的移动幅度,影响输出的特征图大小。

激活函数(如SiLU):影响非线性变换的方式。

层数、通道数(如卷积核数量、隐藏层数量):影响模型的复杂度。

调整这些超参数不涉及对模型本身权重的学习,而是你手动设计模型结构的过程。你可以手动设置这些参数,优化模型的表现。

  • 模型参数(Trainable Parameters):

这是模型在训练过程中通过数据自动学习的参数,主要是卷积层的权重和偏置。比如卷积核内部的权重(Conv2d中的weights和bias)会随着训练数据的输入和误差的反馈不断更新。

这些参数是在反向传播过程中由优化器(如Adam、SGD等)自动调整的,目的是使模型更好地拟合训练数据。(这里的weights和bias是隐含的,不会出现在打印出的网络结构中)

相关推荐
夜清寒风1 分钟前
opencv学习:图像掩码处理和直方图分析及完整代码
人工智能·opencv·学习·算法·机器学习·计算机视觉
数业智能心大陆3 分钟前
数业智能心大陆探索生成式AIGC创新前沿
人工智能
DisonTangor29 分钟前
随着访问范围的扩大 OpenAI o1-mini 现已向免费用户开放
人工智能
越甲八千36 分钟前
opencv彩色图像转灰度图原理
人工智能·opencv·计算机视觉
akhfuiigabv44 分钟前
使用Neo4j-Cypher-FT实现自然语言查询图数据库
数据库·python·oracle·neo4j
asd1_1212844 分钟前
AI创意引擎:优化Prompt提示词的高效提问技巧
人工智能·prompt
lizi888881 小时前
足球大小球及亚盘数据分析与机器学习实战详解:从数据清洗到模型优化
java·人工智能·机器学习·数据挖掘·数据分析
virtaitech1 小时前
OrionX GPU算力池助力AI OCR场景应用
人工智能·ai·ocr·gpu算力·ai算力资源池化
繁依Fanyi1 小时前
828华为云征文|华为Flexus云服务器搭建OnlyOffice私有化在线办公套件
服务器·开发语言·前端·python·算法·华为·华为云
lalahappy1 小时前
文档智能:OCR+Rocketqa+layoutxlm
人工智能