计算机视觉(CV方向)算法基础

秋招临时抱佛脚之作。大纲由GPT提供,内容由博主整理,每日边学边更新,直到拿到满意的offer为止。

1. 基础模型与架构

LeNet、AlexNet、VGG(经典卷积网络演变) ★★★★☆

ResNet、DenseNet(残差结构与梯度流) ★★★★★

MobileNet、ShuffleNet(轻量化网络) ★★★★☆

EfficientNet(复合缩放理念) ★★★★★

Vision Transformer(ViT、Swin Transformer) ★★★★★

ConvNeXt、MaxViT(CNN+ViT融合架构) ★★★★☆

2. 核心视觉任务

图像分类流程:timm 框架、预训练/微调 ★★★★★

目标检测:YOLO 系列、Faster R-CNN、RetinaNet ★★★★★

实例/语义分割:UNet、Mask R-CNN、DeepLab v3 ★★★★★

关键点检测与姿态估计(OpenPose、HRNet) ★★★☆☆

图像生成与修复:GAN、Diffusion Model ★★★☆☆

3. 自监督与增强方法

数据增强:Mixup、CutMix、RandAugment、Mosaic ★★★★★

自监督预训练:SimCLR、BYOL、MAE、DINO ★★★★☆

Contrastive Learning 与表征学习 ★★★★☆

半监督与伪标签方法 ★★★☆☆

4. 评价指标与实用技巧

IoU、mAP、Dice、F1-score、Top-K Accuracy ★★★★★

FPN(特征金字塔)与多尺度特征融合 ★★★★☆

Anchor-free 检测思想(CenterNet、YOLOX) ★★★★☆

NMS 与 Soft-NMS、DIoU-NMS ★★★☆☆

部署优化:量化、剪枝、蒸馏在检测/分割中的应用 ★★★☆☆