技术栈

locateanything

小白狮ww
2 小时前
人工智能·目标检测·计算机视觉·视觉检测·大语言模型·nvidia·locateanything
3B 参数,毫秒级响应:LocateAnything 如何重新定义开放世界目标检测来自 NVIDIA 的新作,LocateAnything-3B,主打视觉语言定位。说实话,看到「3B」这数字我第一反应:能有多能打?结果一看介绍,直接破防了。
我是有底线的