论文笔记: Urban Region Embedding via Multi-View Contrastive Prediction

AAAI 2024

1 INTRO

  • 之前基于多视图的region embedding工作大多遵循相同的模式
    • 单独的单视图表示+多视图融合
  • 但这种方法存在明显的局限性:忽略了不同视图之间的信息一致性
    • 一个区域的多个视图所携带的信息是高度相关的,因此它们的表示应该是一致的
    • 如果能够利用这种相关性,它就可以作为学习每个视图表示过程中的约束,并使知识从一个视图转移到另一个视图
  • ------>提出了一种新的管道一致性学习范式ReCP
    • 由两个主要组成部分组成:
      • 视图内学习
        • 将每个区域与其他不同的区域进行比较,通过对比学习将该区域嵌入到潜在空间中
        • 同时,还利用自动编码器来捕获不同视图的视图特定区域特征,这有助于避免模型陷入一个平凡的解决方案
      • 视图间学习
        • 为了学习区域表示的交叉视图一致性,设计了视图间对比和视图之间的双重预测

2 方法

3 实验

相关推荐
m0_650108249 小时前
MindDrive:融合世界模型与视觉语言模型的端到端自动驾驶框架
论文阅读·自动驾驶·轨迹生成与规划·世界动作模型·e2e-ad·vlm导向评估器·minddrive
LDG_AGI9 小时前
【推荐系统】深度学习训练框架(十七):TorchRec之KeyedJaggedTensor
人工智能·pytorch·深度学习·机器学习·数据挖掘·embedding
CoookeCola9 小时前
无需抠图!Qwen-Image-Layered 一键分解图像图层,支持图层级精准编辑
论文阅读·深度学习·计算机视觉·ai作画·开源·视觉检测·aigc
bylander10 小时前
【论文阅读】VTP:Towards Scalable Pre-training of Visual Tokenizers for Generation
论文阅读·图像处理·大模型
czijin10 小时前
【论文阅读】LoRA: Low-Rank Adaptation of Large Language Models
论文阅读·人工智能·语言模型
有Li11 小时前
诊断文本引导的分层分类全玻片图像表征学习|文献速递-医疗影像分割与目标检测最新技术
论文阅读·深度学习·文献·医学生
万里鹏程转瞬至1 天前
论文简读:Qwen2.5-VL Technical Report
论文阅读·深度学习·多模态
万里鹏程转瞬至1 天前
论文简读:Qwen3-VL Technical Report | Qwen3VL技术报告
论文阅读·深度学习·多模态
阿杰学AI1 天前
AI核心知识61——大语言模型之Embedding (简洁且通俗易懂版)
人工智能·机器学习·ai·语言模型·自然语言处理·embedding·词向量
墨绿色的摆渡人1 天前
论文笔记(一百一十二)Pos3R: 6D Pose Estimation for Unseen Objects Made Easy
论文阅读