深度学习基础知识

卷积神经网络------图像卷积特征提取

卷积核(算子)用来做图像处理时的矩阵,与原图像做运算的参数。

卷积层基本参数(卷积核大小,步长【pytorch默认为1】,padding边缘填充)

输出尺寸 = (输入尺寸 - 卷积核尺寸 + 2*padding)/stride +1

卷积神经网络的基本结构层

输入层:批次 通道 图像大小

卷积层

激活函数:加入非线性因素,提高神经网络对模型的表达能力,解决线性模型所不能解决的问题,CNN较为常用的是Relu。








池化层:不会改变三维矩阵(假设是三通道彩色图像)的深度,但是它可以缩小矩阵的大小。池化操作可以认为是将一张分辨率较高的图片转化为分辨率交底的图片。通过池化层,可以进一步缩小最后全连接层中节点的个数,从而达到减小整个神经网络中的参数的目的。

softmax分类器:将线性分类得到的得分值转化为概率值,进行多分类。pytorch里面内嵌在Loss函数中。

神经网络的训练步骤:

1.定义神经网络的结构和前向传播的输出结果 Network

2.定义损失函数以及选择反向传播优化的算法loss_function(损失函数)/optimizer(优化器)

3.生成会话并在训练数据上反复运行反向传播优化算法 BatchSize/Epochs

神经网络的前向传播和反向传播

前向传播的作用:输入数据经过多层神经元计算后得到一个预测输出值,一般代码中定义的是前向传播

反向传播的作用:把前向预测输出值和真实的值对比计算出loss,通过loss和优化器反向更新神经网络神经元的权重【在卷积神经网络中指的是卷积核的权重,首先会初始化卷积核的权重,后续会通过优化器更新卷积核上的权重,使得卷积核能够更好的提取图片特征】。在代码中只需要写好loss和optim即可。

神经网络的训练 loss function 和 optim

损失函数 的作用:计算神经网络每次迭代的前向计算结果与真实值的差距,从而指导下一步的训练向正确的方向进行,而优化器用与优化神经网络权重,从而增加模型拟合度,降低loss。学习率(learning rate)如果下降幅度太大的话可能会越过全局最优点【可能找不到全局最优,只找到局部最优】,在代码中可以设置学习率,刚开始较大,之后调整为较小的学习速率。
梯度下降 是神经网络比较重要的部分,因为我们通常利用梯度来利用Cost function(成本函数)进行backpropagation(反向传播),不断的迭代,更新权重,偏置参数找到损失最低点,然后最终使我们的模型达到更优的效果。

lossfunction:对于单个样本,prediction和ground truth之间的差异

costfunction:针对一整个数据集,prediction和ground truth之间的差异
SGD 最基础的优化器是GradientDescent,也是最常用的。将传进来的数据只采用一部分,然后一部分一部分的去学习,就可以更快的去达到学习的效果。
Momentum 它不仅考虑当前步骤的学习率,还考虑了上一步的学习趋势,所有比SGD的方法更加快速。
ADAM 计算m时有momentum下坡的属性,计算v时有adagrad阻力的属性,然后再更新参数时,把m和v都考虑进去,实验证明,大多数时候,实验adam都能又快又好的达到目标,迅速收敛。

分类算法的评价指标:

1.正确率(accuracy)被分对的样本在所有样本数中的占比

2.错误率(error rate)与正确率相反

3.灵敏度(sensitivity)所有正例中被分对的比例,衡量了分类器对正例的识别能力。

4.特异性(specificity)所有负例中被分对的比例,衡量了分类器对负例的识别能力

5.精度(precision)精确度的度量,表示被分为正例的示例中实际为正例的比例。

6.召回率(recall)覆盖面的度量,度量有多个正例被分为正例,与灵敏度是一样的。

相关推荐
道可云12 分钟前
5A景区智慧导览服务:从评审标准到技术实践——解析“道可云”智能导览系统如何以“VR+轻量化”重塑文旅体验
人工智能·旅游
科技大视界32 分钟前
2026年6月AI电商智能体推荐指南:AI电商视频生成、卖点提取
人工智能
米小虾1 小时前
Loop Engineering 深度实践指南:9 种 2026 年最新做法与完整代码
人工智能·agent
aaaa954726651 小时前
从Claude Code到平替:我的vibe coding迭代体验
人工智能
叫我:松哥1 小时前
基于机器学习的中文文本抑郁症风险检测系统,包括NLP与传统机器学习的抑郁症识别,准确率92%
人工智能·深度学习·机器学习·自然语言处理·flask·nlp·bootstrap
天天讯通1 小时前
OKCC 呼叫中心安全性能全解析:技术防护与管理措施指南
大数据·开发语言·网络·人工智能·安全·语音识别
hai3152475431 小时前
九章编程法 · 猜数字游戏 (GW-BASIC 重构版) *
人工智能·microsoft·游戏引擎·游戏程序
邵宇然1 小时前
跨沙箱动态传递:WASM 与宿主环境间变长文本数据的零拷贝读取
人工智能
小小小花儿1 小时前
如何使用Codex进行Vibe Coding
人工智能
信也科技布道师1 小时前
Agent Skills + Vibe Testing:构建人机协作的测试闭环
人工智能·agent skills