技术栈
图像大模型
万里守约
11 小时前
论文阅读
·
图像分割
·
多模态
·
语义分割
·
实例分割
·
图像大模型
【论文阅读】SAM-CP:将SAM与组合提示结合起来的多功能分割
近年来,视觉基础模型的快速发展推动了多模态理解的进步,尤其是在图像分割任务中。例如,Segment Anything模型(SAM)在图像Mask分割上表现出色,但在语义及实例分割方面仍存在局限。本文提出的SAM-CP,通过引入可组合的提示机制,显著增强了模型在复杂场景下的语义理解能力。这一方法不仅提高了分割任务的灵活性和准确性,也为视觉模型在开放词汇和实例识别中的应用提供了新的思路,使其在多种视觉任务中具有更广泛的适用性。