论文阅读: Semantics-guided Triplet Loss

ICCV 2021

Abstract

  • 一个度量学习方法,通过浏览语义引导的局部集合去优化内在深度表示。
  • 一个新颖的特征融合模块能有效利用跨模态特异质特征。

Senantics-guided Triplet Loss

基本假设:

  • 在场景语义分割图像中,目标内部相邻像素拥有同样的深度值,而跨目标边界上深度值变化很大。

方法

  • 将语义图像分割成KxK大小的块,stride为1。在每一个块,中心点为anchor,与anchor有相同标签的点为positive 像素 P i + P_i^+ Pi+,反之为Negative像素 P i − P_i^- Pi−。

  • 如果 ∣ P i − ∣ |P_i^-| ∣Pi−∣=0,则 P i P_i Pi位于目标内部,若 ∣ P i − ∣ |P_i^-| ∣Pi−∣和 ∣ P i + ∣ |P_i^+| ∣Pi+∣都大与0,意味着 P i P_i Pi跨域了边界。

  • 对正负距离的定义:

  • 目的在于减少anchor与正样本的距离增加与负样本的距离。

  • 然而目标间的深度变化并非必然的远,因此当负距离超过正距离一定程度,设置一个超参:

  • semantics-guided triplet los L S G T L_{SGT} LSGT是 L p i L_{p_i} Lpi的均值,但只包含满足条件: ∣ P i − ∣ |P_i^-| ∣Pi−∣和 ∣ P i + ∣ |P_i^+| ∣Pi+∣都大于T。

(To be continued)

相关推荐
张较瘦_17 小时前
[论文阅读] 人工智能 + 软件工程 | 大模型破局跨平台测试!LLMRR让iOS/安卓/鸿蒙脚本无缝迁移
论文阅读·人工智能·ios
Matrix_111 天前
论文阅读:VGGT Visual Geometry Grounded Transformer
论文阅读·计算摄影
CV-杨帆1 天前
论文阅读:ICLR 2021 BAG OF TRICKS FOR ADVERSARIAL TRAINING
论文阅读
一碗白开水一2 天前
【论文阅读】Far3D: Expanding the Horizon for Surround-view 3D Object Detection
论文阅读·人工智能·深度学习·算法·目标检测·计算机视觉·3d
张较瘦_2 天前
[论文阅读] 人工智能 + 软件工程 | TDD痛点破解:LLM自动生成测试骨架靠谱吗?静态分析+专家评审给出答案
论文阅读·人工智能·软件工程
张较瘦_2 天前
[论文阅读] 人工智能 + 软件工程 | 首个仓库级多任务调试数据集!RepoDebug揭秘LLM真实调试水平
论文阅读·人工智能
CV-杨帆2 天前
论文阅读:ACL 2023 MEETINGQA: Extractive Question-Answering on Meeting Transcripts
论文阅读
大嘴带你水论文3 天前
震惊!仅用10张照片就能随意编辑3D人脸?韩国KAIST最新黑科技FFaceNeRF解析!
论文阅读·人工智能·python·科技·计算机视觉·3d·transformer
Chandler_Song3 天前
【设计模式】依赖注入和工厂模式
论文阅读
张较瘦_3 天前
[论文阅读] 软件工程 - 需求工程 | 2012-2019年移动应用需求工程研究趋势:需求分析成焦点,数据源却藏着大问题?
论文阅读·软件工程·需求分析