计算机视觉技术-语义分割

讨论的目标检测问题中,我们一直使用方形边界框来标注和预测图像中的目标。 本节将探讨语义分割(semantic segmentation)问题,它重点关注于如何将图像分割成属于不同语义类别的区域。 与目标检测不同,语义分割可以识别并理解图像中每一个像素的内容:其语义区域的标注和预测是像素级的。下图展示了语义分割中图像有关狗、猫和背景的标签。 与目标检测相比,语义分割标注的像素级的边框显然更加精细。

图像分割和实例分割

计算机视觉领域还有2个与语义分割相似的重要问题,即图像分割 (image segmentation)和实例分割(instance segmentation)。 我们在这里将它们同语义分割简单区分一下。

  • 图像分割将图像划分为若干组成区域,这类问题的方法通常利用图像中像素之间的相关性。它在训练时不需要有关图像像素的标签信息,在预测时也无法保证分割出的区域具有我们希望得到的语义。上图中的图像作为输入,图像分割可能会将狗分为两个区域:一个覆盖以黑色为主的嘴和眼睛,另一个覆盖以黄色为主的其余部分身体。

  • 实例分割 也叫同时检测并分割(simultaneous detection and segmentation),它研究如何识别图像中各个目标实例的像素级区域。与语义分割不同,实例分割不仅需要区分语义,还要区分不同的目标实例。例如,如果图像中有两条狗,则实例分割需要区分像素属于的两条狗中的哪一条。

相关推荐
kaikaile19952 分钟前
能量算子的MATLAB实现与详细算法
人工智能·算法·matlab
小布的学习手记7 分钟前
教AI读小说:把《时光机器》变成一串数字的奇妙旅程
人工智能
就是有点傻9 分钟前
机器视觉图像处理学习第一天
人工智能·计算机视觉
Aaron158810 分钟前
数字波束合成DBF与模拟波束合成ABF对比浅析
大数据·人工智能·算法·硬件架构·硬件工程·信息与通信·信号处理
MRDONG111 分钟前
Prompt 到 Context 再到 Harness:AI 工程范式的三次跃迁
人工智能·语言模型·prompt
weixin_4080996713 分钟前
【实战案例】电商自动化:如何用 OCR API 批量识别商品图片文字?(完整方案 + 代码示例)
人工智能·ocr·api·文字识别·电商ocr·商品图片文字识别·ocr 批量识别
非晓为骁13 分钟前
我用AI给自己做了一场深度复盘
人工智能·ai·复盘
新缸中之脑14 分钟前
如何让AI推荐你
人工智能
AI帮小忙15 分钟前
OpenClaw 清除对话记录 & 常用命令速查手册
人工智能
wei_shuo18 分钟前
基于 Rokid 灵珠 AI 平台:OCR 工作流与学术智能体搭建实操指南
人工智能·语音识别·rokid