论文原文:EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks
https://arxiv.org/pdf/1905.11946
官方源码:tpu/models/official/efficientnet at master · tensorflow/tpu · GitHub
https://github.com/tensorflow/tpu/tree/master/models/official/efficientnet
pytorch实现源码:
GitHub - lukemelas/EfficientNet-PyTorch: A PyTorch implementation of EfficientNet
https://github.com/lukemelas/EfficientNet-PyTorch(目标是小目标 + 高分辨率 + 工业场景 的目标检测任务)
基础知识补充
(
情况 A:保存为未压缩图像(如 RGB 8-bit)如:当然我们的是4864*3648
- 分辨率:1920 × 1080 ≈ 2.1 百万像素
- 每像素 3 字节(R+G+B)
- 单帧大小 ≈ 1920 × 1080 × 3 = 6,220,800 字节 ≈ 6.22 MB
- 1000 帧 ≈ 6.22 GB
)
目标:EfficientDet-D0/D1(待实现)
RT-DETR
YOLOv8 + P2 head
为什么需要 EfficientNet?
在 EfficientNet(2019 年由 Google Research 提出)之前,提升 CNN 性能的常见方法是:
- 增加网络深度(如 ResNet → ResNet-152)
- 增加网络宽度(更多通道)
- 使用更高分辨率的输入图像
核心思想:Compound Scaling(复合缩放)
关于基础模型:EfficientNet-B0的笔记
作者使用神经架构搜索(NAS)(待学习) 自动设计了一个轻量高效的基线模型 ------ EfficientNet-B0
- 输入尺寸:224×224
- 结构基于 MobileNetV2 的 inverted residual block + Squeeze-and-Expansion(SE)注意力机制
- 称为 MBConv block(Mobile Inverted Bottleneck Convolution)