目标检测原理分析

目标检测

图像分类(一张图像只属于一个类别)

  • 输入:
    • 一张图像,image
  • 输出:
    • 这张图像属于各个预定义类别的概率
    • 概率分布:
      • 0.2, 0.5, 0.1, 0.2

    • 贪心解码:
      • 选择概率最大的即可

目标检测(一张图像有N个物体)

  • 输入:

    • 一张图像,image
  • 输出:

    • N个物体:
    • 每个物体的定位框(方框,坐标)
    • 每个物体的各类别概率分布
  • 解决办法:

    • 把未知问题转换为已知问题!!!
    • 所有复杂的问题都是简单问题的叠加!!!
    • 把目标检测问题转化为图像分类问题!!!
  • 解决方案:

    1. Anchor-Based:
    • 图像切片
      • 80*80=6400
      • 40*40=1600
      • 20*20=400
      • 合计:8400片
    • 核心:死框 + 修正
    • 对每一片做图像分类
    1. Anchor-Free:
    • 图像切片:
      • 80*80=6400
      • 40*40=1600
      • 20*20=400
      • 合计:8400片
    • 核心:中心点 + 四个方向的成长
    • 对每一片做图像分类
  • 图像分类:

    • 先卷积提取特征,再分类
  • 目标检测:

    • 三个动作:
      • 图像切片
      • 卷积提取特征
      • 分类+回归
    • 方式1:先切片,再对每一片提取特征,然后分类+回归
      • MTCNN
      • 人脸检测
    • 方式2:先提取特征,再切片,然后分类+回归
      • YOLO
      • 目标检测
相关推荐
guanshiyishi2 小时前
ABeam 德硕 | 中国汽车市场(2)——新能源车的崛起与中国汽车市场机遇与挑战
人工智能
极客天成ScaleFlash2 小时前
极客天成NVFile:无缓存直击存储性能天花板,重新定义AI时代并行存储新范式
人工智能·缓存
澳鹏Appen3 小时前
AI安全:构建负责任且可靠的系统
人工智能·安全
蹦蹦跳跳真可爱5894 小时前
Python----机器学习(KNN:使用数学方法实现KNN)
人工智能·python·机器学习
视界宝藏库4 小时前
多元 AI 配音软件,打造独特音频体验
人工智能
xinxiyinhe5 小时前
GitHub上英语学习工具的精选分类汇总
人工智能·deepseek·学习英语精选
ZStack开发者社区5 小时前
全球化2.0 | ZStack举办香港Partner Day,推动AIOS智塔+DeepSeek海外实践
人工智能·云计算
Spcarrydoinb6 小时前
基于yolo11的BGA图像目标检测
人工智能·目标检测·计算机视觉
非ban必选7 小时前
spring-ai-alibaba第四章阿里dashscope集成百度翻译tool
java·人工智能·spring
是店小二呀7 小时前
AI前沿:资本狂潮下的技术暗战:巨头博弈、开源革命与生态重构
人工智能·重构·开源