【计算机视觉--解耦视频分割跟踪任何物体】

UIUC&Adobe开源|无需监督,使用解耦视频分割跟踪任何物体!视频分割的训练数据往往昂贵且需要大量的标注工作。这限制了将端到端算法扩展到新的视频分割任务,特别是在大词汇量的情况下。为了在不为每个个别任务训练视频数据的情况下实现"跟踪任何物体",开发了一种解耦视频分割方法(DEVA),包括任务特定的图像级分割和类/任务无关的双向时间传播。由于这种设计,只需要为目标任务训练一个图像级别的模型(这更便宜),以及一个通用的时间传播模型,只需训练一次即可适用于多个任务。为了有效地结合这两个模块,使用双向传播来对来自不同帧的分割假设进行(半)在线融合,以生成一致的分割结果。展示了这种解耦的方法在多个数据稀缺任务中表现出色,包括大词汇量视频全景分割、开放世界视频分割、指代视频分割和无监督视频对象分割。

项目主页:https://hkchengrex.com/Tracking-Anything-with-DEVA/

论文地址:https://arxiv.org/abs/2309.03903

代码地址:https://github.com/hkchengrex/Tracking-Anything-with-DEVA

相关推荐
东离与糖宝9 分钟前
Java 21 虚拟线程与 AI 推理结合的最新实践
java·人工智能
火山引擎开发者社区11 分钟前
火山养“龙虾”日志 | 14 大神仙玩法,原来 AI Agent 还能这么用
人工智能
新缸中之脑22 分钟前
Hermes-Agent 简明指南
人工智能
鲸鱼在dn23 分钟前
【CS336】Lecture1课程讲义-语言模型发展历程&Tokenization概念
人工智能·语言模型·自然语言处理
WiSirius24 分钟前
LLM:基于 AgentScope + Streamlit 的 AI Agent脑暴室
人工智能·深度学习·自然语言处理·大模型·llama
跨境猫小妹26 分钟前
采购交期拉长如何把补货策略从经验改为预测
大数据·人工智能·产品运营·跨境电商·营销策略
console.log('npc')30 分钟前
Cursor,Trae,Claude Code如何协作生产出一套前后台app?
前端·人工智能·react.js·设计模式·ai·langchain·ai编程
AI视觉网奇33 分钟前
动作迁移算法笔记 2026
人工智能·笔记
@TsUnAmI~40 分钟前
当翻译不只是翻译:我做了一个AI桌面翻译助手
人工智能