技术栈

空间推理

HyperAI超神经
11 天前
人工智能·3d·大模型·多模态·空间推理·3d感知·3d理解
深度估计准确率冲上0.9,Meta提出VLM³,论证视觉模型天生会学3D,以Qwen3-VL-4B为基础实现多任务的统一建模三维空间感知是自动驾驶、机器人、三维重建等领域的核心基础能力,其目标是从二维图像中恢复真实世界的空间结构、尺度信息与几何关系。与图像分类、目标检测等二维视觉任务相比,三维感知不仅要求语义理解能力,还需要精确的空间推理与几何建模,因此长期以来被视为计算机视觉领域最具挑战性的研究方向之一。
飞机火车巴雷特
8 个月前
论文阅读·大模型·空间推理·答案集编程
【论文阅读】DSPy-based neural-symbolic pipeline to enhance spatial reasoning in LLMs论文题目:DSPy-based neural-symbolic pipeline to enhance spatial reasoning in LLMs
Struart_R
10 个月前
计算机视觉·语言模型·transformer·大语言模型·vlm·视觉理解·空间推理
SpatialVLM和SpatialRGPT论文解读目录一、SpatialVLM1、概述2、方法3、实验二、SpatialRGPT1、概述2、方法3、训练方法
我是有底线的