目标检测原理分析

MechMaster2024-07-26 10:54

目标检测

图像分类（一张图像只属于一个类别）
目标检测（一张图像有N个物体）

图像分类（一张图像只属于一个类别）

输入：
- 一张图像，image
输出：
- 这张图像属于各个预定义类别的概率
- 概率分布：
  - $0.2, 0.5, 0.1, 0.2$
- 贪心解码：
  - 选择概率最大的即可

目标检测（一张图像有N个物体）

输入：
- 一张图像，image
输出：
- N个物体：
- 每个物体的定位框（方框，坐标）
- 每个物体的各类别概率分布
解决办法：
- 把未知问题转换为已知问题！！！
- 所有复杂的问题都是简单问题的叠加！！！
- 把目标检测问题转化为图像分类问题！！！
解决方案：
1. Anchor-Based：
- 图像切片
  - 80*80=6400
  - 40*40=1600
  - 20*20=400
  - 合计：8400片
- 核心：死框 + 修正
- 对每一片做图像分类
1. Anchor-Free：
- 图像切片：
  - 80*80=6400
  - 40*40=1600
  - 20*20=400
  - 合计：8400片
- 核心：中心点 + 四个方向的成长
- 对每一片做图像分类
图像分类：
- 先卷积提取特征，再分类
目标检测：
- 三个动作：
  - 图像切片
  - 卷积提取特征
  - 分类+回归
- 方式1：先切片，再对每一片提取特征，然后分类+回归
  - MTCNN
  - 人脸检测
- 方式2：先提取特征，再切片，然后分类+回归
  - YOLO
  - 目标检测

上一篇：【网络】网络编程套接字——UDP、TCP、UDP接口使用、TCP接口使用、UDP程序实例、TCP程序实例

下一篇：【教程】Node.js+Apache 部署网页全过程（非常详细！）

热门推荐

01KGG转MP3工具|非KGM文件|解密音频 02YOLOv8入门 | 重要性能衡量指标、训练结果评价及分析及影响mAP的因素【发论文关注的指标】03从零安装 LLaMA-Factory 微调 Qwen 大模型成功及所有的坑 04【SpeedAI科研小助手】2分钟极速解决知网维普重复率、AIGC率过高，一键全文降！文件格式不变，公式都保留的！05DeepSeek各版本说明与优缺点分析 06Coze扣子平台完整体验和实践（附国内和国际版对比）07Ubuntu24.04安装中文输入法 08YOLOv5改进 | 添加CA注意力机制 + 增加预测层 + 更换损失函数之GIoU 09苍穹外卖面试总结 10组基轨迹建模 GBTM的介绍与实现（Stata 或 R）