【计算机视觉CV:目标检测】--1.目标检测简介

目录

1.图像识别背景

1.1.图像识别三大任务

1.1.图像识别的发展

2.什么是目标检测

2.1.目标检测定义

2.1.1.物体

2.1.2.位置

2.2.目标检测的技术发展历史

[3 目标检测应用场景](#3 目标检测应用场景)

[3.1 行业应用](#3.1 行业应用)

[3.2 应用类别](#3.2 应用类别)


1.图像识别背景

1.1.图像识别三大任务

  • 目标识别:或者说分类,定性目标,确定目标是什么(图a)

  • 目标检测:定位目标,确定目标是什么以及位置(图b)

  • 目标分割:像素级的对前景与背景进行分类,将背景剔除(图c,图d)

目标检测:技术成熟并且使用更多的场景

目标分割:适用于理解要求较高的场景,如无人驾驶中对道路和非道路的分割。

1.1.图像识别的发展

  • 通用场景

谷歌、微软、Facebook、百度、阿里巴巴在内的科技巨头都花费了大量的人力财力做研究,搭建了很多图像识别的平台。

  • 垂直场景
    • 医疗领域:医疗影像的检测
    • 林木产业:木板树种检测识别

垂直应用场景里的行业特质挖掘和经验积累往往会被忽视,所以在垂直领域的行业中大量的公司正在开发相当多的图像应用。

2.什么是目标检测

2.1.目标检测定义

识别图片中有哪些物体以及物体的位置(坐标位置)

2.1.1.物体

即图像中存在的物体对象,但是能检测哪些物体会受到人为设定限制。

目标检测中能检测出来的物体取决于当前任务(数据集)需要检测的物体有哪些。假设我们的目标检测模型定位是检测动物(牛、羊、猪、狗、猫五种结果),那么模型对任何一张图片输出结果不会输出鸭子、书籍等其它类型结果。

2.1.2.位置

目标检测的位置信息一般由两种格式(以图片左上角为原点(0,0)):

  • 极坐标表示:(xmin, ymin, xmax, ymax)
    • xmin,ymin:x,y坐标的最小值
    • xmin,ymin:x,y坐标的最大值
  • 中心点坐标:(x_center, y_center, w, h)
    • x_center, y_center:目标检测框的中心点坐标
    • w,h:目标检测框的宽、高

假设这个图像是1000x800,所有这些坐标都是构建在像素层面上:

中心点坐标结果如下:

2.2.目标检测的技术发展历史

  • 传统目标检测方法(候选区域+手工特征提取 +分类器)
    • HOG+SVM、DPM
  • region proposal+CNN提取分类的 目标检测框架
    • (R-CNN, SPP-NET, Fast R-CNN, Faster R-CNN)
  • 端到端(End-to-End)的目标检测框架
    • YOLO、SSD

3 目标检测应用场景

3.1 行业应用

  • 公安行业的应用

    • 公安行业用户的迫切需求是在海量的视频信息中,发现犯罪嫌疑人的线索。人工智能在视频内容的特征提取、内容理解方面有着天然的优势。可实时分析视频内容,检测运动对象,识别人、车属性信息,并通过网络传递到后端人工智能的中心数据库进行存储。
  • 农作物的应用

    • 农业中农作物表面的病虫害识别也需要用到目标检测技术
  • 医疗影像检测

    • 人工智能在医学中的应用目前是一个热门的话题,医学影像图像中病变部位检测和识别对于诊断的自动化,提供优质的治疗具有重要的意义。
  • 电商行业的应用

    • 电商行业中充满无数的商品,利用检测功能查询相关商品,快速找到用户需要的商品类型或者品牌类别,从而提高电商领域的用户满意度

3.2 应用类别

  • 道路检测
  • 动物检测

  • 商品检测

  • 车牌检测

  • 菜品检测

  • 车型检测
相关推荐
Dfreedom.9 小时前
计算机视觉全景图
人工智能·算法·计算机视觉·图像算法
xrgs_shz10 小时前
直方图法、最大类间方差法、迭代法和自适应阈值法的图像分割的基本原理和MATLAB实现
人工智能·计算机视觉·matlab
QQ6765800811 小时前
服装计算机视觉数据集 连衣裙数据集 衣服类别识别 毛衣数据集 夹克衫AI识别 衬衫识别 裤子 数据集 yolo格式数据集
人工智能·yolo·计算机视觉·连衣裙·衣服类别·毛衣数据集·夹克衫ai
清空mega15 小时前
动手学深度学习——多尺度锚框
人工智能·深度学习·目标跟踪
云程笔记17 小时前
021.损失函数深度解读:YOLO的定位、置信度、分类损失计算
人工智能·yolo·机器学习·计算机视觉·分类·数据挖掘
Together_CZ17 小时前
AutoFigure-Edit: Generating Editable Scientific Illustration——生成可编辑的科学插图
计算机视觉·autofigure-edit·generating·editable·scientific·illustration·生成可编辑的科学插图
羊羊小栈17 小时前
基于「YOLO目标检测 + 多模态AI分析」的智慧农业茶叶病害检测预警系统
人工智能·yolo·目标检测·计算机视觉·毕业设计·大作业
XuecWu318 小时前
原生多模态颠覆Scaling Law?解读语言“参数需求型”与视觉“数据需求型”核心差异
人工智能·深度学习·算法·计算机视觉·语言模型
前端摸鱼匠19 小时前
YOLOv11 在零售领域实战:利用公开的商品检测数据集 (如 SKU110K 的子集),训练一个 YOLOv11 模型,用于识别货架上的各种商品
人工智能·yolo·目标检测·ai·目标跟踪·视觉检测·零售
深度学习lover20 小时前
<数据集>yolo微藻识别<目标检测>
人工智能·python·yolo·目标检测·计算机视觉·微藻识别