论文阅读: Semantics-guided Triplet Loss

BlueagleAI2024-01-03 14:40

ICCV 2021

Abstract

一个度量学习方法，通过浏览语义引导的局部集合去优化内在深度表示。
一个新颖的特征融合模块能有效利用跨模态特异质特征。

Senantics-guided Triplet Loss

基本假设：

在场景语义分割图像中，目标内部相邻像素拥有同样的深度值，而跨目标边界上深度值变化很大。

方法

将语义图像分割成KxK大小的块，stride为1。在每一个块，中心点为anchor,与anchor有相同标签的点为positive 像素 P i + P_i^+ Pi+，反之为Negative像素 P i − P_i^- Pi−。
如果 ∣ P i − ∣ |P_i^-| ∣Pi−∣=0,则 P i P_i Pi位于目标内部,若 ∣ P i − ∣ |P_i^-| ∣Pi−∣和 ∣ P i + ∣ |P_i^+| ∣Pi+∣都大与0，意味着 P i P_i Pi跨域了边界。
对正负距离的定义：
目的在于减少anchor与正样本的距离增加与负样本的距离。
然而目标间的深度变化并非必然的远，因此当负距离超过正距离一定程度，设置一个超参：
semantics-guided triplet los L S G T L_{SGT} LSGT是 L p i L_{p_i} Lpi的均值，但只包含满足条件: ∣ P i − ∣ |P_i^-| ∣Pi−∣和 ∣ P i + ∣ |P_i^+| ∣Pi+∣都大于T。

(To be continued)

上一篇：BIO和NIO编程(待完善)

下一篇：opencv期末练习题（1）附带解析

热门推荐

01如何新建文件夹？电脑新建文件夹的4种方法 02GitHub 镜像站点 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）05AI科技热点日报 | 2026年07月01日 06AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 072026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？08微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 09Agnes AI 免费 API 接入指南：文本、生图、生视频，一套接口全免费 102026 年 AI 大模型 & AI 编程工具实战全总结