【计算机视觉CV:目标检测】--1.目标检测简介

西柚小萌新2026-01-08 14:07

目录

1.图像识别背景

1.1.图像识别三大任务

1.1.图像识别的发展

2.什么是目标检测

2.1.目标检测定义

2.2.目标检测的技术发展历史

[3 目标检测应用场景](#3 目标检测应用场景)

[3.1 行业应用](#3.1 行业应用)

[3.2 应用类别](#3.2 应用类别)

1.图像识别背景

1.1.图像识别三大任务

目标识别：或者说分类，定性目标，确定目标是什么（图a）
目标检测：定位目标，确定目标是什么以及位置（图b）
目标分割：像素级的对前景与背景进行分类，将背景剔除（图c，图d）

目标检测：技术成熟并且使用更多的场景

目标分割：适用于理解要求较高的场景，如无人驾驶中对道路和非道路的分割。

1.1.图像识别的发展

通用场景

谷歌、微软、Facebook、百度、阿里巴巴在内的科技巨头都花费了大量的人力财力做研究，搭建了很多图像识别的平台。

垂直场景
- 医疗领域：医疗影像的检测
- 林木产业：木板树种检测识别

垂直应用场景里的行业特质挖掘和经验积累往往会被忽视，所以在垂直领域的行业中大量的公司正在开发相当多的图像应用。

2.什么是目标检测

2.1.目标检测定义

识别图片中有哪些物体以及物体的位置（坐标位置）

2.1.1.物体

即图像中存在的物体对象，但是能检测哪些物体会受到人为设定限制。

目标检测中能检测出来的物体取决于当前任务（数据集）需要检测的物体有哪些。假设我们的目标检测模型定位是检测动物（牛、羊、猪、狗、猫五种结果），那么模型对任何一张图片输出结果不会输出鸭子、书籍等其它类型结果。

2.1.2.位置

目标检测的位置信息一般由两种格式（以图片左上角为原点(0,0)）：

极坐标表示：(xmin, ymin, xmax, ymax)
- xmin,ymin:x,y坐标的最小值
- xmin,ymin:x,y坐标的最大值
中心点坐标：(x_center, y_center, w, h)
- x_center, y_center:目标检测框的中心点坐标
- w,h:目标检测框的宽、高

假设这个图像是1000x800，所有这些坐标都是构建在像素层面上：

中心点坐标结果如下：

2.2.目标检测的技术发展历史

传统目标检测方法（候选区域+手工特征提取 +分类器）
- HOG+SVM、DPM
region proposal+CNN提取分类的 目标检测框架
- (R-CNN, SPP-NET, Fast R-CNN, Faster R-CNN)
端到端（End-to-End）的目标检测框架
- YOLO、SSD

3 目标检测应用场景

3.1 行业应用

公安行业的应用
- 公安行业用户的迫切需求是在海量的视频信息中，发现犯罪嫌疑人的线索。人工智能在视频内容的特征提取、内容理解方面有着天然的优势。可实时分析视频内容，检测运动对象，识别人、车属性信息，并通过网络传递到后端人工智能的中心数据库进行存储。
农作物的应用
- 农业中农作物表面的病虫害识别也需要用到目标检测技术
医疗影像检测
- 人工智能在医学中的应用目前是一个热门的话题，医学影像图像中病变部位检测和识别对于诊断的自动化，提供优质的治疗具有重要的意义。
电商行业的应用
- 电商行业中充满无数的商品，利用检测功能查询相关商品，快速找到用户需要的商品类型或者品牌类别，从而提高电商领域的用户满意度

3.2 应用类别

道路检测

动物检测
商品检测
车牌检测
菜品检测

车型检测

上一篇：K8S中使用 reloader 实现滚动升级

下一篇：IE8-WindowsXP-x86-CHS_23253_BDdl.exe 安装步骤（XP 32位简体中文版）

热门推荐

01GitHub 镜像站点 022026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 03如何新建文件夹？电脑新建文件夹的4种方法 04幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 05AI科技热点日报 | 2026年07月01日 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 08【AI前线观察】2026年国产开源大模型全面横评：从 DeepSeek V4 到 Kimi K3，谁才是开发者的最优选择？092026 年 AI 大模型 & AI 编程工具实战全总结 102026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？