零样本目标检测及分割模型

零样本目标检测

Grounding DINO

YOLO-World

零样本分割

SAM系列

DinoV3

DINOv3 是 Meta AI 在 2025 年 推出的最新一代自监督视觉基础模型 (Self-Supervised Vision Foundation Model),是 DINO 系列(DINO → DINOv2 → DINOv3)的集大成者。它无需任何人工标注,仅通过海量无标签图像学习通用、高分辨率、语义丰富的视觉特征,在冻结参数(frozen backbone)的情况下,即可在多种下游任务(如分类、分割、深度估计、医学影像等)中达到 SOTA 或接近 SOTA 的性能。

相关推荐
予枫的编程笔记几秒前
Elasticsearch深度搜索与查询DSL实战:精准定位数据的核心技法
java·大数据·人工智能·elasticsearch·搜索引擎·全文检索
小北方城市网1 分钟前
第 6 课:云原生架构终极落地|K8s 全栈编排与高可用架构设计实战
大数据·人工智能·python·云原生·架构·kubernetes·geo
创作者mateo2 分钟前
机器学习基本概念简介(全)
人工智能·机器学习
飞睿科技4 分钟前
乐鑫ESP32-S3-BOX-3,面向AIoT与边缘智能的新一代开发套件
人工智能·嵌入式硬件·esp32·智能家居·乐鑫科技
Rabbit_QL6 分钟前
【数学基础】机器学习中的抽样:你的数据是样本,不是世界
人工智能·机器学习
淬炼之火8 分钟前
笔记:Contrastive Object-Aware Fusion
图像处理·笔记·计算机视觉·多模态·图像融合
金融RPA机器人丨实在智能11 分钟前
深度拆解 RPA 机器人:定义、应用、价值与未来方向
人工智能·rpa·实在rpa
青主创享阁12 分钟前
技术破局农业利润困局:玄晶引擎AI数字化解决方案的架构设计与落地实践
大数据·人工智能
datamonday15 分钟前
[EAI-037] π0.6* 基于RECAP方法与优势调节的自进化VLA机器人模型
人工智能·深度学习·机器人·具身智能·vla
Toky丶21 分钟前
【文献阅读】Pt2-Llm: Post-Training Ternarization For Large Language Models
人工智能·语言模型·自然语言处理