目标检测原理分析

目标检测

图像分类(一张图像只属于一个类别)

  • 输入:
    • 一张图像,image
  • 输出:
    • 这张图像属于各个预定义类别的概率
    • 概率分布:
      • 0.2, 0.5, 0.1, 0.2

    • 贪心解码:
      • 选择概率最大的即可

目标检测(一张图像有N个物体)

  • 输入:

    • 一张图像,image
  • 输出:

    • N个物体:
    • 每个物体的定位框(方框,坐标)
    • 每个物体的各类别概率分布
  • 解决办法:

    • 把未知问题转换为已知问题!!!
    • 所有复杂的问题都是简单问题的叠加!!!
    • 把目标检测问题转化为图像分类问题!!!
  • 解决方案:

    1. Anchor-Based:
    • 图像切片
      • 80*80=6400
      • 40*40=1600
      • 20*20=400
      • 合计:8400片
    • 核心:死框 + 修正
    • 对每一片做图像分类
    1. Anchor-Free:
    • 图像切片:
      • 80*80=6400
      • 40*40=1600
      • 20*20=400
      • 合计:8400片
    • 核心:中心点 + 四个方向的成长
    • 对每一片做图像分类
  • 图像分类:

    • 先卷积提取特征,再分类
  • 目标检测:

    • 三个动作:
      • 图像切片
      • 卷积提取特征
      • 分类+回归
    • 方式1:先切片,再对每一片提取特征,然后分类+回归
      • MTCNN
      • 人脸检测
    • 方式2:先提取特征,再切片,然后分类+回归
      • YOLO
      • 目标检测
相关推荐
mtouch33316 分钟前
GIS+VR地理信息虚拟现实XR MR AR
大数据·人工智能·ar·无人机·xr·vr·mr
一人の梅雨29 分钟前
1688 拍立淘接口深度开发:从图像识别到供应链匹配的技术实现
人工智能·算法·计算机视觉
dundunmm1 小时前
【数据集】WebQuestions
人工智能·llm·数据集·知识库问答·知识库
却道天凉_好个秋1 小时前
OpenCV(五):鼠标控制
人工智能·opencv·鼠标控制
IT_陈寒2 小时前
Redis性能优化:5个被低估的配置项让你的QPS提升50%
前端·人工智能·后端
Christo32 小时前
关于K-means和FCM的凸性问题讨论
人工智能·算法·机器学习·数据挖掘·kmeans
飞翔的佩奇2 小时前
【完整源码+数据集+部署教程】 水果叶片分割系统: yolov8-seg-dyhead
人工智能·yolo·计算机视觉·数据集·yolov8·yolo11·水果叶片分割系统
小许学java2 小时前
Spring AI快速入门以及项目的创建
java·开发语言·人工智能·后端·spring·ai编程·spring ai
人工智能技术派2 小时前
Qwen-Audio:一种新的大规模音频-语言模型
人工智能·语言模型·音视频
lpfasd1232 小时前
从OpenAI发布会看AI未来:中国就业市场的重构与突围
人工智能·重构