【计算机视觉CV:目标检测】--1.目标检测简介

目录

1.图像识别背景

1.1.图像识别三大任务

1.1.图像识别的发展

2.什么是目标检测

2.1.目标检测定义

2.1.1.物体

2.1.2.位置

2.2.目标检测的技术发展历史

[3 目标检测应用场景](#3 目标检测应用场景)

[3.1 行业应用](#3.1 行业应用)

[3.2 应用类别](#3.2 应用类别)


1.图像识别背景

1.1.图像识别三大任务

  • 目标识别:或者说分类,定性目标,确定目标是什么(图a)

  • 目标检测:定位目标,确定目标是什么以及位置(图b)

  • 目标分割:像素级的对前景与背景进行分类,将背景剔除(图c,图d)

目标检测:技术成熟并且使用更多的场景

目标分割:适用于理解要求较高的场景,如无人驾驶中对道路和非道路的分割。

1.1.图像识别的发展

  • 通用场景

谷歌、微软、Facebook、百度、阿里巴巴在内的科技巨头都花费了大量的人力财力做研究,搭建了很多图像识别的平台。

  • 垂直场景
    • 医疗领域:医疗影像的检测
    • 林木产业:木板树种检测识别

垂直应用场景里的行业特质挖掘和经验积累往往会被忽视,所以在垂直领域的行业中大量的公司正在开发相当多的图像应用。

2.什么是目标检测

2.1.目标检测定义

识别图片中有哪些物体以及物体的位置(坐标位置)

2.1.1.物体

即图像中存在的物体对象,但是能检测哪些物体会受到人为设定限制。

目标检测中能检测出来的物体取决于当前任务(数据集)需要检测的物体有哪些。假设我们的目标检测模型定位是检测动物(牛、羊、猪、狗、猫五种结果),那么模型对任何一张图片输出结果不会输出鸭子、书籍等其它类型结果。

2.1.2.位置

目标检测的位置信息一般由两种格式(以图片左上角为原点(0,0)):

  • 极坐标表示:(xmin, ymin, xmax, ymax)
    • xmin,ymin:x,y坐标的最小值
    • xmin,ymin:x,y坐标的最大值
  • 中心点坐标:(x_center, y_center, w, h)
    • x_center, y_center:目标检测框的中心点坐标
    • w,h:目标检测框的宽、高

假设这个图像是1000x800,所有这些坐标都是构建在像素层面上:

中心点坐标结果如下:

2.2.目标检测的技术发展历史

  • 传统目标检测方法(候选区域+手工特征提取 +分类器)
    • HOG+SVM、DPM
  • region proposal+CNN提取分类的 目标检测框架
    • (R-CNN, SPP-NET, Fast R-CNN, Faster R-CNN)
  • 端到端(End-to-End)的目标检测框架
    • YOLO、SSD

3 目标检测应用场景

3.1 行业应用

  • 公安行业的应用

    • 公安行业用户的迫切需求是在海量的视频信息中,发现犯罪嫌疑人的线索。人工智能在视频内容的特征提取、内容理解方面有着天然的优势。可实时分析视频内容,检测运动对象,识别人、车属性信息,并通过网络传递到后端人工智能的中心数据库进行存储。
  • 农作物的应用

    • 农业中农作物表面的病虫害识别也需要用到目标检测技术
  • 医疗影像检测

    • 人工智能在医学中的应用目前是一个热门的话题,医学影像图像中病变部位检测和识别对于诊断的自动化,提供优质的治疗具有重要的意义。
  • 电商行业的应用

    • 电商行业中充满无数的商品,利用检测功能查询相关商品,快速找到用户需要的商品类型或者品牌类别,从而提高电商领域的用户满意度

3.2 应用类别

  • 道路检测
  • 动物检测

  • 商品检测

  • 车牌检测

  • 菜品检测

  • 车型检测
相关推荐
X_Cosmic1 天前
从零开始:YOLO11 训练 DOTA OBB 遥感数据旋转框目标检测
python·yolo·目标检测
Rui_Freely1 天前
Vins-Fusion之 相机—IMU在线标定(两帧间旋转估计)(十)
人工智能·算法·计算机视觉
棒棒的皮皮1 天前
【深度学习】YOLO模型精度优化全攻略
人工智能·深度学习·yolo·计算机视觉
集和诚JHCTECH1 天前
BRAV-7722赋能手术机器人:高性能控制方案,守护精准手术的每一刻
人工智能·嵌入式硬件·计算机视觉
Jerryhut1 天前
背景建模实战:从帧差法到混合高斯模型的 OpenCV 实现
人工智能·opencv·计算机视觉
棒棒的皮皮1 天前
【深度学习】YOLO实战之模型训练
人工智能·深度学习·yolo·计算机视觉
数据光子1 天前
【YOLO数据集】遛狗未牵绳目标检测
人工智能·python·yolo·目标检测·计算机视觉
乞丐哥1 天前
乞丐哥的私房菜(Ubuntu OpenCV篇——Image Processing 节 之 Out-of-focus Deblur Filter 失焦去模糊滤波器 滤镜)
c++·图像处理·opencv·ubuntu·计算机视觉
AI科技星1 天前
引力场与磁场的几何统一:磁矢势方程的第一性原理推导、验证与诠释
数据结构·人工智能·经验分享·线性代数·算法·计算机视觉·概率论