神经 网络

笔记记录
层次
复制代码
全连接层
卷积层
池化层
批量规范化层
激活函数
丢弃层
经典模型
复制代码
LeNet
AlexNet
VGG
Nin
GoogleNet
ResNet
DenseNet

神经网络层的主要类别

python 复制代码
    "基础结构层": ["全连接层", "卷积层", "池化层"],
    "序列处理层": ["RNN", "LSTM", "GRU", "Transformer"],
    "归一化层": ["BatchNorm", "LayerNorm", "InstanceNorm"],
    "正则化层": ["Dropout", "DropPath"],
    "注意力机制": ["自注意力", "交叉注意力", "多头注意力"],
    "嵌入层": ["词嵌入", "位置编码"],
    "激活函数": ["ReLU", "Sigmoid", "Tanh", "Softmax"],
    "特殊连接": ["残差连接", "跳跃连接"],
    "采样层": ["上采样", "下采样", "转置卷积"]

神经网络经典架构时间线

python 复制代码
    "2012": ["AlexNet"],           # 深度学习复兴
    "2014": ["VGG", "GoogLeNet"],  # 深度与宽度探索  
    "2015": ["ResNet", "UNet"],    # 残差连接,医学影像
    "2016": ["DenseNet"],          # 密集连接
    "2017": ["Transformer"],       # 注意力革命
    "2018": ["BERT", "GAN"],       # 预训练模型,生成模型
    "2020": ["Vision Transformer"] # CV的Transformer时代
架构选择指南
图像分类 ResNet, EfficientNet 平衡精度和效率
目标检测 YOLO, Faster R-CNN 实时vs高精度
语义分割 U-Net, DeepLab 医学影像,街景分割
机器翻译 Transformer, BERT 当前最优选择
文本生成 GPT系列 自回归语言模型
图像生成 GAN, VAE, Diffusion 高质量图像合成
语音识别 WaveNet, Conformer 时序信号处理
实用建议
  • 1.从预训练开始:使用在ImageNet等大数据集上预训练的模型
  • 2.迁移学习:针对特定任务微调最后几层
  • 3.架构搜索:使用EfficientNet等自动搜索的架构
  • 4.计算预算:根据可用资源选择合适规模的模型
  • 5.持续学习:关注新架构的发展,如Swin Transformer、ConvNeXt等
笔记记录
相关推荐
Lihua奏2 天前
从单核到多核:CPU为什么不能再只靠提频变快
深度学习
拾年2752 天前
大模型的"聪明"从哪来?聊聊 AI 数据集的那些事儿
人工智能·深度学习·机器学习
饼干哥哥6 天前
开源Skills|搭建亚马逊动态关键词库系统,每天抓SSS级机会词
人工智能·深度学习·数据分析
武子康8 天前
调查研究-191 SenseVoice 不只是 ASR:把语音从“转文字“升级成“理解状态“
人工智能·深度学习·openai
武子康9 天前
调查研究-189 Kronos 调研:金融 K 线基础模型,是真突破,还是量化圈的新玩具?
人工智能·深度学习·openai
xiao5kou4chang6kai415 天前
MATLAB机器学习、深度学习--从数据预处理到模型训练
深度学习·机器学习·matlab·数据预处理
renhongxia115 天前
世界模型作为AGI落地底层底座的作用
人工智能·深度学习·生成对抗网络·自然语言处理·知识图谱·agi
计算机科研狗@OUC15 天前
(cvpr26) AIMDepth: Asymmetric Image-Event Mamba for Monocular Depth Estimation
人工智能·深度学习·计算机视觉
β添砖java15 天前
深度学习(22)网络中的网络NiN
人工智能·深度学习
Kobebryant-Manba15 天前
深度学习时候d2l报错和使用问题
人工智能·深度学习