深度学习的基本概念汇总

这里小小总结一下看论文时常见到的名词,不用再一个个搜索啦!!!

1.batch size

batch size是指在训练集中取的样本数,batch的size设置的不能太大也不能太小,因此实际工程中最常用的就是mini-batch,一般size设置为几十或者几百。 对于二阶优化算法,减小batch换来的收敛速度提升远不如引入大量噪声导致的性能下降,因此在使用二阶优化算法时,往往要采用大batch哦。此时往往batch设置成几千甚至一两万才能发挥出最佳性能

2.channel

channel 定义:The dimensionality of the output space, i.e. the number of output channels (filters) in the convolution. ------mxnet (一般channels的含义是,每个卷积层中卷积核的数量

3.Conv1d,Conv2d,Conv3d

Conv1d即向一个维度进行卷积,常常用于自然语言处理

Conv2d即向两个维度进行卷积,在计算机视觉上,如手写数字识别,输入一张长*宽的手写数字图片

Conv3d即向三个维度进行卷积,在某些图像的处理上会更加高效,例如一些医学图像的分割有时会有更好的结果

4.Zero Padding(零填充)

Zero_padding 被广泛使用在卷积层中,因为图像在使用过滤器(卷积核)卷积后往往图像会缩小降维,丢失一些信息,为保持输入和输出的相同空间维度,故在水平轴和垂直轴的开始和结束处都添加了0来进行填充

5.Rescaling(区间缩放)

常见的区间缩放为 Min-Max Rescaling,对数据进行线性变换,将特征值映射将特征值映射到区间[0,1]中

6.Standardization(标准化)

标准化即为概率论与数理统计中常见的Z-score标准化。在特征值的均值(mean)和标准差(standard deviation)的基础上计算得出。标准化是依照特征矩阵的列处理数据,其通过求Z-score的方法

7.Normalization(归一化)

归一化是将每个样本缩放为单位范数(每个样本的范数为1)。归一化是依照特征矩阵的行处理数据,其目的在于样本向量在点乘运算或其他核函数计算相似性时,拥有统一的标准,也就是说都转化为"单位向量"

相关推荐
人工智能AI技术2 分钟前
终身学习 Agent:积累知识、不遗忘、可进化
人工智能
DFCED3 分钟前
突发!Sora 之父 Bill Peebles 离职:OpenAI 理想主义的又一次落幕
人工智能·大模型·agent·sora
_Evan_Yao4 分钟前
RAG中的“Chunk”艺术:我试过10种切分策略后总结的结论
java·人工智能·后端·python·软件工程
拾薪6 分钟前
[SuperPower] Brainingstorm - 流程控制架构分析
网络·人工智能·ai·架构·superpower·brainstorming
AI自动化工坊9 分钟前
SemaClaw开源框架实践指南:从提示工程到安全工程的AI代理基础设施变革
人工智能·开源·ai agent·semaclaw
今天你TLE了吗10 分钟前
LLM到Agent&RAG——AI概念概述 第二章:提示词
人工智能·笔记·后端·学习
找方案43 分钟前
AI 视觉创作工具 Claude Design 来了!Anthropic 的野心远不止 AI 作图
人工智能·原型设计·ai工具·claude design
wltx16881 小时前
谷歌SEO+外贸版GEO优化步骤?
人工智能·python
龙腾AI白云1 小时前
智能体如何配知识库?
人工智能·机器学习·数据挖掘
IT_陈寒1 小时前
Vue的响应式把我坑惨了,原来问题出在这
前端·人工智能·后端