开放词汇

大江东去浪淘尽千古风流人物13 天前
slam·语义slam·vio·开放词汇·动态场景
【RADIO-ViPE】动态环境下的在线开放词汇语义SLAM:视觉-语言-几何紧耦合BA与自适应鲁棒核深度解析RADIO-ViPE 是一个面向动态环境的在线语义 SLAM 系统,能够将任意自然语言查询与三维场景中的局部区域和物体关联起来(开放词汇语义定位)。与现有方法依赖标定好的 RGB-D 输入不同,RADIO-ViPE 直接处理原始单目 RGB 视频流,不需要相机内参、深度传感器或位姿初始化。其核心创新在于:将来自 RADIO 聚合基础模型的多模态嵌入(视觉+语言)与几何场景信息在初始化、优化和因子图连接三个层面进行紧耦合融合,并通过时序一致的自适应鲁棒核处理动态物体干扰。在 TUM-RGBD 动态基准测试上
zy_destiny5 个月前
人工智能·深度学习·算法·机器学习·计算机视觉·语义分割·开放词汇
SegEarth-OV系列(二):面向遥感图像的无训练开放词汇分割SegEarth-OV2相比于SegEarth-OV的主要区别是,将开放词汇的遥感影像语义分割应用到SAR图像上,可同时对光学和SAR影像进行语义分割。
这张生成的图像能检测吗8 个月前
人工智能·计算机视觉·图像生成·1024程序员节·开放词汇·3d重建
(论文速读)开放词汇3D场景理解的掩蔽点-实体对比论文题目:Masked Point-Entity Contrast for Open-Vocabulary 3D Scene Understanding(开放词汇3D场景理解的掩蔽点-实体对比)
叶舟2 年前
yolo·目标检测·yolo-world·开放词汇·视觉语言结合·open-vocabulary
YOLO-World:实时开放词汇目标检测paper:https://arxiv.org/pdf/2401.17270.pdfGithub:GitHub - AILab-CVC/YOLO-World: Real-Time Open-Vocabulary Object Detection
我是有底线的