目标检测
图像分类(一张图像只属于一个类别)
- 输入:
- 一张图像,image
- 输出:
- 这张图像属于各个预定义类别的概率
- 概率分布:
- [0.2, 0.5, 0.1, 0.2]
- 贪心解码:
- 选择概率最大的即可
目标检测(一张图像有N个物体)
-
输入:
- 一张图像,image
-
输出:
- N个物体:
- 每个物体的定位框(方框,坐标)
- 每个物体的各类别概率分布
-
解决办法:
- 把未知问题转换为已知问题!!!
- 所有复杂的问题都是简单问题的叠加!!!
- 把目标检测问题转化为图像分类问题!!!
-
解决方案:
- Anchor-Based:
- 图像切片
- 80*80=6400
- 40*40=1600
- 20*20=400
- 合计:8400片
- 核心:死框 + 修正
- 对每一片做图像分类
- Anchor-Free:
- 图像切片:
- 80*80=6400
- 40*40=1600
- 20*20=400
- 合计:8400片
- 核心:中心点 + 四个方向的成长
- 对每一片做图像分类
-
图像分类:
- 先卷积提取特征,再分类
-
目标检测:
- 三个动作:
- 图像切片
- 卷积提取特征
- 分类+回归
- 方式1:先切片,再对每一片提取特征,然后分类+回归
- MTCNN
- 人脸检测
- 方式2:先提取特征,再切片,然后分类+回归
- YOLO
- 目标检测
- 三个动作: