深度学习基础知识

卷积神经网络------图像卷积特征提取

卷积核(算子)用来做图像处理时的矩阵,与原图像做运算的参数。

卷积层基本参数(卷积核大小,步长【pytorch默认为1】,padding边缘填充)

输出尺寸 = (输入尺寸 - 卷积核尺寸 + 2*padding)/stride +1

卷积神经网络的基本结构层

输入层:批次 通道 图像大小

卷积层

激活函数:加入非线性因素,提高神经网络对模型的表达能力,解决线性模型所不能解决的问题,CNN较为常用的是Relu。








池化层:不会改变三维矩阵(假设是三通道彩色图像)的深度,但是它可以缩小矩阵的大小。池化操作可以认为是将一张分辨率较高的图片转化为分辨率交底的图片。通过池化层,可以进一步缩小最后全连接层中节点的个数,从而达到减小整个神经网络中的参数的目的。

softmax分类器:将线性分类得到的得分值转化为概率值,进行多分类。pytorch里面内嵌在Loss函数中。

神经网络的训练步骤:

1.定义神经网络的结构和前向传播的输出结果 Network

2.定义损失函数以及选择反向传播优化的算法loss_function(损失函数)/optimizer(优化器)

3.生成会话并在训练数据上反复运行反向传播优化算法 BatchSize/Epochs

神经网络的前向传播和反向传播

前向传播的作用:输入数据经过多层神经元计算后得到一个预测输出值,一般代码中定义的是前向传播

反向传播的作用:把前向预测输出值和真实的值对比计算出loss,通过loss和优化器反向更新神经网络神经元的权重【在卷积神经网络中指的是卷积核的权重,首先会初始化卷积核的权重,后续会通过优化器更新卷积核上的权重,使得卷积核能够更好的提取图片特征】。在代码中只需要写好loss和optim即可。

神经网络的训练 loss function 和 optim

损失函数 的作用:计算神经网络每次迭代的前向计算结果与真实值的差距,从而指导下一步的训练向正确的方向进行,而优化器用与优化神经网络权重,从而增加模型拟合度,降低loss。学习率(learning rate)如果下降幅度太大的话可能会越过全局最优点【可能找不到全局最优,只找到局部最优】,在代码中可以设置学习率,刚开始较大,之后调整为较小的学习速率。
梯度下降 是神经网络比较重要的部分,因为我们通常利用梯度来利用Cost function(成本函数)进行backpropagation(反向传播),不断的迭代,更新权重,偏置参数找到损失最低点,然后最终使我们的模型达到更优的效果。

lossfunction:对于单个样本,prediction和ground truth之间的差异

costfunction:针对一整个数据集,prediction和ground truth之间的差异
SGD 最基础的优化器是GradientDescent,也是最常用的。将传进来的数据只采用一部分,然后一部分一部分的去学习,就可以更快的去达到学习的效果。
Momentum 它不仅考虑当前步骤的学习率,还考虑了上一步的学习趋势,所有比SGD的方法更加快速。
ADAM 计算m时有momentum下坡的属性,计算v时有adagrad阻力的属性,然后再更新参数时,把m和v都考虑进去,实验证明,大多数时候,实验adam都能又快又好的达到目标,迅速收敛。

分类算法的评价指标:

1.正确率(accuracy)被分对的样本在所有样本数中的占比

2.错误率(error rate)与正确率相反

3.灵敏度(sensitivity)所有正例中被分对的比例,衡量了分类器对正例的识别能力。

4.特异性(specificity)所有负例中被分对的比例,衡量了分类器对负例的识别能力

5.精度(precision)精确度的度量,表示被分为正例的示例中实际为正例的比例。

6.召回率(recall)覆盖面的度量,度量有多个正例被分为正例,与灵敏度是一样的。

相关推荐
人工智能交叉前沿技术,3 分钟前
机器学习在催化剂设计中的应用理论加实操
人工智能·机器学习
声网4 分钟前
Edge 浏览器推出 Copilot Vision:免费实时解析屏幕内容;Aqua Voice:极速 AI 语音输入工具丨日报
人工智能
努力犯错玩AI8 分钟前
16.4B参数仅激活2.8B!Kimi-VL-A3B开源:长文本、多模态、低成本的AI全能选手
人工智能·后端·开源
Watermelo61714 分钟前
《Science》观点解读:AI无法创造真正的智能体(AI Agent)
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理·数据挖掘
suke16 分钟前
企业级部署实操: SGLang 多节点集群部署 Qwen 系列大模型
人工智能·ai编程
灏瀚星空26 分钟前
AI 模型高效化:推理加速与训练优化的技术原理与理论解析
开发语言·人工智能·深度学习·程序人生·机器人·智慧城市·量子计算
mex_wayne35 分钟前
基础学习:(6)nanoGPT
人工智能·学习·transformer
都是些老物件41 分钟前
目标检测概述
人工智能·目标检测·计算机视觉
AI大模型团团1 小时前
从基础概念到前沿应用了解机器学习
人工智能·python·随机森林·机器学习·ai·线性回归·llama
七灵微1 小时前
PyTorch进阶学习笔记[长期更新]
pytorch·深度学习·学习