目标检测原理分析

目标检测

图像分类(一张图像只属于一个类别)

  • 输入:
    • 一张图像,image
  • 输出:
    • 这张图像属于各个预定义类别的概率
    • 概率分布:
      • 0.2, 0.5, 0.1, 0.2

    • 贪心解码:
      • 选择概率最大的即可

目标检测(一张图像有N个物体)

  • 输入:

    • 一张图像,image
  • 输出:

    • N个物体:
    • 每个物体的定位框(方框,坐标)
    • 每个物体的各类别概率分布
  • 解决办法:

    • 把未知问题转换为已知问题!!!
    • 所有复杂的问题都是简单问题的叠加!!!
    • 把目标检测问题转化为图像分类问题!!!
  • 解决方案:

    1. Anchor-Based:
    • 图像切片
      • 80*80=6400
      • 40*40=1600
      • 20*20=400
      • 合计:8400片
    • 核心:死框 + 修正
    • 对每一片做图像分类
    1. Anchor-Free:
    • 图像切片:
      • 80*80=6400
      • 40*40=1600
      • 20*20=400
      • 合计:8400片
    • 核心:中心点 + 四个方向的成长
    • 对每一片做图像分类
  • 图像分类:

    • 先卷积提取特征,再分类
  • 目标检测:

    • 三个动作:
      • 图像切片
      • 卷积提取特征
      • 分类+回归
    • 方式1:先切片,再对每一片提取特征,然后分类+回归
      • MTCNN
      • 人脸检测
    • 方式2:先提取特征,再切片,然后分类+回归
      • YOLO
      • 目标检测
相关推荐
SmartBrain4 分钟前
Spring Boot 中常用注解总结(AI工程化)
java·人工智能·spring boot·后端
帐篷Li8 分钟前
Superpowers:让 AI 编程助手拥有专业级软件开发流程
人工智能·everything
明月照山海-11 分钟前
机器学习周报三十七
人工智能·机器学习
TOWE technology13 分钟前
从“制造”到“智造”:智能PDU如何成为智慧工厂的电力“神经中枢”
大数据·人工智能·制造·数据中心·电源管理·智能pdu
flying_131414 分钟前
图神经网络分享系列-HAN(Heterogeneous Graph Attention Network)(一)
人工智能·深度学习·图神经网络·异构图·han·节点级注意力·语义级注意力
MIka17 分钟前
CopilotKit 入门:用 Runtime 和 React Core 搭建真正可用的 AI Copilot
人工智能·typescript·agent
一 铭17 分钟前
Agent设计方式-工具调用:从自然语言到工具调用的桥梁
人工智能·大模型
用户48159301959118 分钟前
MCP vs Function Calling:两个总被搞混的概念,一次说清楚
人工智能
黄粱梦醒19 分钟前
OpenClaw-window安装教程以及通用常用命令
人工智能·llm
2501_9181269120 分钟前
学习所有python写服务器的语句
服务器·人工智能·python·学习·个人开发