技术栈
空间推理
HyperAI超神经
11 天前
人工智能
·
3d
·
大模型
·
多模态
·
空间推理
·
3d感知
·
3d理解
深度估计准确率冲上0.9,Meta提出VLM³,论证视觉模型天生会学3D,以Qwen3-VL-4B为基础实现多任务的统一建模
三维空间感知是自动驾驶、机器人、三维重建等领域的核心基础能力,其目标是从二维图像中恢复真实世界的空间结构、尺度信息与几何关系。与图像分类、目标检测等二维视觉任务相比,三维感知不仅要求语义理解能力,还需要精确的空间推理与几何建模,因此长期以来被视为计算机视觉领域最具挑战性的研究方向之一。
飞机火车巴雷特
8 个月前
论文阅读
·
大模型
·
空间推理
·
答案集编程
【论文阅读】DSPy-based neural-symbolic pipeline to enhance spatial reasoning in LLMs
论文题目:DSPy-based neural-symbolic pipeline to enhance spatial reasoning in LLMs
Struart_R
10 个月前
计算机视觉
·
语言模型
·
transformer
·
大语言模型
·
vlm
·
视觉理解
·
空间推理
SpatialVLM和SpatialRGPT论文解读
目录一、SpatialVLM1、概述2、方法3、实验二、SpatialRGPT1、概述2、方法3、训练方法
我是有底线的