论文阅读: Semantics-guided Triplet Loss

ICCV 2021

Abstract

  • 一个度量学习方法,通过浏览语义引导的局部集合去优化内在深度表示。
  • 一个新颖的特征融合模块能有效利用跨模态特异质特征。

Senantics-guided Triplet Loss

基本假设:

  • 在场景语义分割图像中,目标内部相邻像素拥有同样的深度值,而跨目标边界上深度值变化很大。

方法

  • 将语义图像分割成KxK大小的块,stride为1。在每一个块,中心点为anchor,与anchor有相同标签的点为positive 像素 P i + P_i^+ Pi+,反之为Negative像素 P i − P_i^- Pi−。

  • 如果 ∣ P i − ∣ |P_i^-| ∣Pi−∣=0,则 P i P_i Pi位于目标内部,若 ∣ P i − ∣ |P_i^-| ∣Pi−∣和 ∣ P i + ∣ |P_i^+| ∣Pi+∣都大与0,意味着 P i P_i Pi跨域了边界。

  • 对正负距离的定义:

  • 目的在于减少anchor与正样本的距离增加与负样本的距离。

  • 然而目标间的深度变化并非必然的远,因此当负距离超过正距离一定程度,设置一个超参:

  • semantics-guided triplet los L S G T L_{SGT} LSGT是 L p i L_{p_i} Lpi的均值,但只包含满足条件: ∣ P i − ∣ |P_i^-| ∣Pi−∣和 ∣ P i + ∣ |P_i^+| ∣Pi+∣都大于T。

(To be continued)

相关推荐
噜~噜~噜~13 小时前
论文笔记:“Mind the Gap Preserving and Compensating for the Modality Gap in“
论文阅读
张较瘦_13 小时前
[论文阅读] AI+ | 从 “刚性科层” 到 “智能协同”:一文读懂 AI 应对国家安全风险的核心逻辑
论文阅读·人工智能
张较瘦_1 天前
[论文阅读] AI+ | GenAI重塑智慧图书馆:华东师大实践AI虚拟馆员,解放馆员聚焦高价值任务
论文阅读·人工智能
CoookeCola2 天前
MovieNet (paper) :推动电影理解研究的综合数据集与基准
数据库·论文阅读·人工智能·计算机视觉·视觉检测·database
张较瘦_3 天前
[论文阅读] AI+ | AI如何重塑审计行业?从“手工筛查”到“智能决策”:AI审计的核心逻辑与未来路径
论文阅读·人工智能
苦瓜汤补钙3 天前
论文阅读——Segment Anything(Meta AI)——SAM
论文阅读·图像处理·人工智能·nlp·ai编程
CV-杨帆3 天前
论文阅读:arxiv 2025 Safety in Large Reasoning Models: A Survey
论文阅读
张较瘦_4 天前
[论文阅读] AI | 大语言模型服务系统服务级目标和系统级指标优化研究
论文阅读·人工智能·语言模型
Vizio<4 天前
《基于电阻层析成像(ERT)的机器人皮肤空间灵敏度均衡:通过应变系数分布优化》ICRA 2025 论文解读
论文阅读·机器人·机器人触觉
三木今天学习了嘛5 天前
【VLA & Markov】VLA 架构和构建模块 与 Markov 带来的时序思考
论文阅读