技术栈

vlm推理

m0_65010824
4 小时前
论文阅读·零样本·机器人导航·视觉语言导航·未知环境快速适配·符号化场景图·vlm推理
VLN-Zero:零样本机器人导航的神经符号视觉语言规划框架摘要:在未知环境中实现快速适配是机器人实现规模化现实世界自主化的关键要求,然而现有方法要么依赖穷尽式的环境探索,要么采用刚性的导航策略,均无法实现良好的跨环境泛化。本文提出 VLN-Zero—— 一款分两阶段的视觉语言导航框架,该框架利用视觉语言模型高效构建符号化场景图,并实现零样本的神经符号导航。在探索阶段,通过结构化提示词引导基于视觉语言模型的探索过程走向具备信息性和多样性的轨迹,最终生成紧凑的场景图表示。在部署阶段,神经符号规划器通过对场景图和环境观测的推理生成可执行的规划方案,同时缓存增强的执行模
我是有底线的