pytorch的卷积层池化层和非线性变化 和机器学习线性回归

卷积层:

两个输出的情况 就会有两个通道 可以改变通道数的

最简单的神经网络结构:

nn.Mudule就是继承父类

super执行的是 先执行父类函数里面的

forward执行的就是前向网络,就是往前推进的,当然也有反向转播,那就是用来就gradient dicent了,求导计算了。

卷积后的结果展示:

这里有个小细节

224 *244输出 224 *224 肯定是加了padding的,如何算出这个padding 官网给了公式

这个一般用不到,写论文科研可以再去官网查看

下面介绍池化层

mxpool是下采样,mxunpool是上采样,dilation是空洞卷积,ceil------mode来保留,用来对应下面情况

最大池化操作,这里有一点要注意,stride(每次核移动的步进)默认为卷积核一样大小

池化的直观感受就是变模糊了,保留了数据的主要特征,减小了数据量。

下面介绍非线性:

inplace如果是1的话就是替换input,如果是flase的话,就是把输出用另一个变量来承接

一般来说是要false的,保留以前的数据嘛

下面是使用sigmoid函数进行的非线性处理

插播stm32学习的:

陀螺仪原理:

下面介绍机器学习线性回归的问题:

x就是各种已知道的特征,这就是回归任务的第一步,线性回归

,这是实际值

第二步 就是我有label 和feartures 用函数预测出预测label,比较好坏。选出比较规则。

利用梯度下降,第三步找到最好loss

这种情况看人品?no 线性回归不需要担心,永远是第一种情况

梯度下降的算法:

用二次拟合更好的model:

或者更高的次来拟合更好的model 和更低的loss:

直到你用更高次的model来拟合,train 的结果更高了,但是test的结果更差了,这个就是过拟合了overfitting了

这个时候我们还要考虑:有时候只考虑一种feature肯定是不够的

用冲激函数来乘 来做选择,考虑多种feature

把全部能想象到的参数都加进去,因为我们不知道有哪些参数是影响的,这样做,我们在train上可以得到很低,但是又可能会过拟合!做到这里,还可以回到第二步,定义model的好坏。第二部只考虑的了预测值的error,regularization是加上额外的wi

要求参数越小越好,降低敏感度,提高函数的平滑性!

也不可以太平滑了,就相当于一个水平线,啥也干不成。调整朗木达来调整,为什么朗木达里面没有加上b?因为调整b的大小根本没用

总结:一个输出和多个feature有关,不过我们不确定那些有影响,就会overfiting,可以用正则化来平滑函数

相关推荐
Power20246665 小时前
NLP论文速读|LongReward:基于AI反馈来提升长上下文大语言模型
人工智能·深度学习·机器学习·自然语言处理·nlp
数据猎手小k5 小时前
AndroidLab:一个系统化的Android代理框架,包含操作环境和可复现的基准测试,支持大型语言模型和多模态模型。
android·人工智能·机器学习·语言模型
sp_fyf_20246 小时前
计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-11-01
人工智能·深度学习·神经网络·算法·机器学习·语言模型·数据挖掘
知来者逆7 小时前
研究大语言模型在心理保健智能顾问的有效性和挑战
人工智能·神经网络·机器学习·语言模型·自然语言处理
老艾的AI世界7 小时前
新一代AI换脸更自然,DeepLiveCam下载介绍(可直播)
图像处理·人工智能·深度学习·神经网络·目标检测·机器学习·ai换脸·视频换脸·直播换脸·图片换脸
love_and_hope8 小时前
Pytorch学习--神经网络--搭建小实战(手撕CIFAR 10 model structure)和 Sequential 的使用
人工智能·pytorch·python·深度学习·学习
Chef_Chen8 小时前
从0开始学习机器学习--Day14--如何优化神经网络的代价函数
神经网络·学习·机器学习
AI街潜水的八角9 小时前
基于C++的决策树C4.5机器学习算法(不调包)
c++·算法·决策树·机器学习
喵~来学编程啦10 小时前
【论文精读】LPT: Long-tailed prompt tuning for image classification
人工智能·深度学习·机器学习·计算机视觉·论文笔记
Chef_Chen11 小时前
从0开始学习机器学习--Day13--神经网络如何处理复杂非线性函数
神经网络·学习·机器学习