深度学习复习笔记

深度前馈神经网络

卷积神经网络

Advanced卷积神经网络

Lightweight CNN

dwconv

squeezenet

这边右侧的e3是3x3卷积吧

SENet

在通道维度压一下,强迫各维度混合学习,再还原

ShuffleNet

Group Convolution在 AlexNet 中引入,用于将模型分布到两块 GPU 上。但这样某个通道的输出只能来自一小部分输入通道,这样阻止了通道之间的信息流

打乱通道就能交流了

CondenseNet

分组卷积存在通道之间的信息沟通不畅以及特征多样性不足的问题。CondenseNet提出的解决策略是在训练的过程中让模型选择更好的分组方式
自学习分组卷积可以分成两个阶段:浓缩阶段和优化阶段。其中浓缩阶段用于剪枝没用的特征,优化阶段用于优化剪枝之后的网络。

浓缩时,在训练该网络时使用了分组lasso正则项,会有 1/C 的特征被剪枝掉
CondenseNet的剪枝并不是直接将这个特征删除,而是通过掩码的形式将被剪枝的特征置0,因此在训练的过程中CondenseNet的时间并没有减少,反而会需要更多的显存用来保存掩码

EfficientNet

用NAS调模型宽度和深度

间隔损失

contrastive loss

其中d代表两个样本特征的欧氏距离,y为两个样本是否匹配的标签,y=1代表两个样本相似或者匹配,y=0则代表不匹配。margin为设定的阈值,这种损失函数主要是用在降维中,即本来相似的样本,在经过降维(特征提取)后,在特征空间中,两个样本仍旧相似;而原本不相似的样本,在经过降维后,在特征空间中,两个样本仍旧不相似。

Triplet Loss

输入是一个三元组 <a, p, n>

  • a: anchor,表示一个基准样本
  • p: positive, 与 a 是同一类别的样本,比如就是同一个人的照片
  • n: negative, 与 a 是不同类别的样本,比如就是不同人的照片

希望让a和p的距离尽可能小,而a和n的距离尽可能大

Center Loss

为了解决open set问题,即当训练集和测试集的类别不完全相同的情况

通过MSE做类似聚类的loss,保证最小化类内距离的同时保证特征可分,来提高特征之间的可判别性

L-Softmax

在softmax基础上将 theta 1 乘以正整数m

m越大,决策间隔越大

Modified Softmax

限制了一些条件:∥Wi∥=1,bi=0,由这些条件,可以得到修正的损失函数

相关推荐
夏天是冰红茶1 小时前
DINO原理详解
人工智能·深度学习·机器学习
吴佳浩4 小时前
Python入门指南(六) - 搭建你的第一个YOLO检测API
人工智能·后端·python
SHIPKING3934 小时前
【AI应用开发设计指南】基于163邮箱SMTP服务实现验证登录
人工智能
yong99904 小时前
基于SIFT特征提取与匹配的MATLAB图像拼接
人工智能·计算机视觉·matlab
知秋一叶1235 小时前
Miloco 深度打通 Home Assistant,实现设备级精准控制
人工智能·智能家居
春日见5 小时前
在虚拟机上面无法正启动机械臂的控制launch文件
linux·运维·服务器·人工智能·驱动开发·ubuntu
————A5 小时前
强化学习----->轨迹、回报、折扣因子和回合
人工智能·python
CareyWYR6 小时前
每周AI论文速递(251215-251219)
人工智能
做cv的小昊6 小时前
【TJU】信息检索与分析课程笔记和练习(1)认识文献
经验分享·笔记·学习·搜索引擎·全文检索
weixin_409383126 小时前
在kaggle训练Qwen/Qwen2.5-1.5B-Instruct 通过中二时期qq空间记录作为训练数据 训练出中二的模型为目标 第一次训练 好像太二了
人工智能·深度学习·机器学习·qwen