技术栈
locateanything
小白狮ww
2 小时前
人工智能
·
目标检测
·
计算机视觉
·
视觉检测
·
大语言模型
·
nvidia
·
locateanything
3B 参数,毫秒级响应:LocateAnything 如何重新定义开放世界目标检测
来自 NVIDIA 的新作,LocateAnything-3B,主打视觉语言定位。说实话,看到「3B」这数字我第一反应:能有多能打?结果一看介绍,直接破防了。
我是有底线的