目标检测原理分析

目标检测

图像分类(一张图像只属于一个类别)

  • 输入:
    • 一张图像,image
  • 输出:
    • 这张图像属于各个预定义类别的概率
    • 概率分布:
      • 0.2, 0.5, 0.1, 0.2

    • 贪心解码:
      • 选择概率最大的即可

目标检测(一张图像有N个物体)

  • 输入:

    • 一张图像,image
  • 输出:

    • N个物体:
    • 每个物体的定位框(方框,坐标)
    • 每个物体的各类别概率分布
  • 解决办法:

    • 把未知问题转换为已知问题!!!
    • 所有复杂的问题都是简单问题的叠加!!!
    • 把目标检测问题转化为图像分类问题!!!
  • 解决方案:

    1. Anchor-Based:
    • 图像切片
      • 80*80=6400
      • 40*40=1600
      • 20*20=400
      • 合计:8400片
    • 核心:死框 + 修正
    • 对每一片做图像分类
    1. Anchor-Free:
    • 图像切片:
      • 80*80=6400
      • 40*40=1600
      • 20*20=400
      • 合计:8400片
    • 核心:中心点 + 四个方向的成长
    • 对每一片做图像分类
  • 图像分类:

    • 先卷积提取特征,再分类
  • 目标检测:

    • 三个动作:
      • 图像切片
      • 卷积提取特征
      • 分类+回归
    • 方式1:先切片,再对每一片提取特征,然后分类+回归
      • MTCNN
      • 人脸检测
    • 方式2:先提取特征,再切片,然后分类+回归
      • YOLO
      • 目标检测
相关推荐
每天都要写算法(努力版)几秒前
【神经网络与深度学习】训练集与验证集的功能解析与差异探究
人工智能·深度学习·神经网络
vocal19 分钟前
谷歌第七版Prompt Engineering—第一部分
人工智能
MonkeyKing_sunyuhua20 分钟前
5.6 Microsoft Semantic Kernel:专注于将LLM集成到现有应用中的框架
人工智能·microsoft·agent
arbboter28 分钟前
【AI插件开发】Notepad++ AI插件开发1.0发布和使用说明
人工智能·大模型·notepad++·ai助手·ai插件·aicoder·notepad++插件开发
IT_Octopus40 分钟前
AI工程pytorch小白TorchServe部署模型服务
人工智能·pytorch·python
果冻人工智能1 小时前
AI军备竞赛:我们是不是正在造一个无法控制的神?
人工智能
暴龙胡乱写博客1 小时前
OpenCV---图像预处理(四)
人工智能·opencv·计算机视觉
程序员辣条1 小时前
深度测评 RAG 应用评估框架:指标最全面的 RAGas
人工智能·程序员
curdcv_po1 小时前
字节跳动Trae:一款革命性的免费AI编程工具完全评测
人工智能·trae
程序员辣条1 小时前
为什么需要提示词工程?什么是提示词工程(prompt engineering)?为什么需要提示词工程?收藏我这一篇就够了!
人工智能·程序员·产品经理