技术栈

目标物体导航

v_JULY_v
21 小时前
视觉语言导航·具身导航·nava3·目标物体导航·naviafford
NavA3——双VLM架构下的先“推理解析”后“定位导航”:理解任意指令,导航至任意地点,查找任意目标由于我司这月最新签的一个订单长沙分部每月每签下一个订单,都会事后总结成功的原因,比如这一次的原因是又包含了视觉导航(其次是灵巧操作和语音交互),故对导航这方面的研究与日俱深,而在研究、落地之余,可顺带把本博客内的「导航解读系列」变得更为深入、系统(想真正吃透一个方向,便得不断深入各种细节,建立体系)