Segment anything(图片分割大模型)

目录

[1.Segment anything](#1.Segment anything)

2.补充图像分割和目标检测的区别


1.Segment anything

定义:图像分割通用大模型

延深:可以预计视觉检测大模型,也快了。

进一步理解:传统图像分割对于下图处理时,识别房子的是识别房子的模型,识别草的是识别草的模型,识别人的是识别人的模型,而Segment anything可一次识别所有物体。可以这样说以前我们的模型是训练得到几个,几十个,几千个标签,而Segment anything可以得到所有标签,

再进一步理解:chagpt在实现文本任务时我们发现,他同样是聚焦所有点,只需要几个提示词去引导它,对应下图,比方说,找到图中病毒或者找到图中蓝色区域。在 Segment anything同样是这个道理,我们对图中想要识别的对象,点三个点(提示词),模型便知道你想识别这个对象。也可以用一个框(提示词)对这个对象作为指导。通用大模型不用一次把所有东西都训练好,在有大模型后,有提示词,可以持续学习。

2.补充图像分割和目标检测的区别

定义:在这两个任务中,我们都希望找到图像中某些感兴趣的项目的位置,比如说图中人的位置。从输出理解两者区别:

  1. 目标检测:预测包围盒(对于下面的狗只用框框起来即可)

YOLO,Fast-RCNN,似乎还有个SSD

输入:一个矩阵(输入图像),每个像素有 3 个值(红、绿、蓝),如果是黑色和白色,则每个像素有 1 个值。

输出:由左上角和大小定义的边框列表。

  1. 图像分割:预测掩模(对下面的狗比方说,红色的狗,周边标注时要对每一个像素点标注,过于麻烦)

Mask RCNN,Unet,Segnet

输入:是一个矩阵(输入图像),每个像素有 3 个值(红、绿、蓝),如果是黑色和白色,则每个像素有 1 个值

输出:是一个矩阵(掩模图像),每个像素有一个包含指定类别的

结论:输出不同,从下图理解二者区别:简单理解目标检测在图中表现为框,图像分割是一种类别的颜色。

补充一下语义分割和实例分割:

语义分割:(图片分割)是对图像中的每一块像素都应该给出类别标签。

实例分割:(目标检测)只需要给出我们关注的物体的像素的类别标签。

结论:两者其实没有本质的区别。

参考文献

1.分割一切!刷爆CV圈子的视觉终极模型Segment Anything(SAM),唐宇迪博士两小时原理精讲、源码复现带你实操!_哔哩哔哩_bilibili

2.图像分割与目标检测与区别_图像分割和目标检测区别_必修居士的博客-CSDN博客

3.计算机视觉:图像检测和图像分割有什么区别?_图像识别与分割_喜欢打酱油的老鸟的博客-CSDN博客

相关推荐
carpell17 分钟前
【语义分割专栏】3:Segnet实战篇(附上完整可运行的代码pytorch)
人工智能·python·深度学习·计算机视觉·语义分割
智能汽车人30 分钟前
自动驾驶---SD图导航的规划策略
人工智能·机器学习·自动驾驶
mengyoufengyu40 分钟前
DeepSeek11-Ollama + Open WebUI 搭建本地 RAG 知识库全流程指南
人工智能·深度学习·deepseek
Tianyanxiao41 分钟前
华为×小鹏战略合作:破局智能驾驶深水区的商业逻辑深度解析
大数据·人工智能·经验分享·华为·金融·数据分析
rit84324991 小时前
基于BP神经网络的语音特征信号分类
人工智能·神经网络·分类
一点.点1 小时前
AlphaDrive:通过强化学习和推理释放自动驾驶中 VLM 的力量
人工智能·机器学习·自动驾驶
科技小E1 小时前
口罩佩戴检测算法AI智能分析网关V4工厂/工业等多场景守护公共卫生安全
网络·人工智能
说私域1 小时前
基于定制开发开源AI智能名片S2B2C商城小程序的首屏组件优化策略研究
人工智能·小程序·开源·零售
vlln2 小时前
2025年与2030年AI及AI智能体 (Agent) 市场份额分析报告
人工智能·深度学习·神经网络·ai
栗克2 小时前
Halcon 图像预处理②
人工智能·计算机视觉·halcon