目标检测原理分析

目标检测

图像分类(一张图像只属于一个类别)

  • 输入:
    • 一张图像,image
  • 输出:
    • 这张图像属于各个预定义类别的概率
    • 概率分布:
      • [0.2, 0.5, 0.1, 0.2]
    • 贪心解码:
      • 选择概率最大的即可

目标检测(一张图像有N个物体)

  • 输入:

    • 一张图像,image
  • 输出:

    • N个物体:
    • 每个物体的定位框(方框,坐标)
    • 每个物体的各类别概率分布
  • 解决办法:

    • 把未知问题转换为已知问题!!!
    • 所有复杂的问题都是简单问题的叠加!!!
    • 把目标检测问题转化为图像分类问题!!!
  • 解决方案:

    1. Anchor-Based:
    • 图像切片
      • 80*80=6400
      • 40*40=1600
      • 20*20=400
      • 合计:8400片
    • 核心:死框 + 修正
    • 对每一片做图像分类
    1. Anchor-Free:
    • 图像切片:
      • 80*80=6400
      • 40*40=1600
      • 20*20=400
      • 合计:8400片
    • 核心:中心点 + 四个方向的成长
    • 对每一片做图像分类
  • 图像分类:

    • 先卷积提取特征,再分类
  • 目标检测:

    • 三个动作:
      • 图像切片
      • 卷积提取特征
      • 分类+回归
    • 方式1:先切片,再对每一片提取特征,然后分类+回归
      • MTCNN
      • 人脸检测
    • 方式2:先提取特征,再切片,然后分类+回归
      • YOLO
      • 目标检测
相关推荐
阿里云云原生6 分钟前
山石网科×阿里云通义灵码,开启研发“AI智造”新时代
网络·人工智能·阿里云·ai程序员·ai程序员体验官
diemeng11191 小时前
AI前端开发技能变革时代:效率与创新的新范式
前端·人工智能
有Li1 小时前
跨中心模型自适应牙齿分割|文献速递-医学影像人工智能进展
人工智能
牧歌悠悠6 小时前
【深度学习】Unet的基础介绍
人工智能·深度学习·u-net
坚毅不拔的柠檬柠檬6 小时前
AI革命下的多元生态:DeepSeek、ChatGPT、XAI、文心一言与通义千问的行业渗透与场景重构
人工智能·chatgpt·文心一言
坚毅不拔的柠檬柠檬6 小时前
2025:人工智能重构人类文明的新纪元
人工智能·重构
jixunwulian6 小时前
DeepSeek赋能AI边缘计算网关,开启智能新时代!
人工智能·边缘计算
Archie_IT6 小时前
DeepSeek R1/V3满血版——在线体验与API调用
人工智能·深度学习·ai·自然语言处理
大数据追光猿7 小时前
Python应用算法之贪心算法理解和实践
大数据·开发语言·人工智能·python·深度学习·算法·贪心算法
灵感素材坊7 小时前
解锁音乐创作新技能:AI音乐网站的正确使用方式
人工智能·经验分享·音视频