【计算机视觉--解耦视频分割跟踪任何物体】

UIUC&Adobe开源|无需监督,使用解耦视频分割跟踪任何物体!视频分割的训练数据往往昂贵且需要大量的标注工作。这限制了将端到端算法扩展到新的视频分割任务,特别是在大词汇量的情况下。为了在不为每个个别任务训练视频数据的情况下实现"跟踪任何物体",开发了一种解耦视频分割方法(DEVA),包括任务特定的图像级分割和类/任务无关的双向时间传播。由于这种设计,只需要为目标任务训练一个图像级别的模型(这更便宜),以及一个通用的时间传播模型,只需训练一次即可适用于多个任务。为了有效地结合这两个模块,使用双向传播来对来自不同帧的分割假设进行(半)在线融合,以生成一致的分割结果。展示了这种解耦的方法在多个数据稀缺任务中表现出色,包括大词汇量视频全景分割、开放世界视频分割、指代视频分割和无监督视频对象分割。

项目主页:https://hkchengrex.com/Tracking-Anything-with-DEVA/

论文地址:https://arxiv.org/abs/2309.03903

代码地址:https://github.com/hkchengrex/Tracking-Anything-with-DEVA

相关推荐
云草桑8 分钟前
.net AI开发04 第八章 引入RAG知识库与文档管理核心能力及事件总线
数据库·人工智能·microsoft·c#·asp.net·.net·rag
2501_9333295513 分钟前
Infoseek数字公关AI中台技术解析:如何构建企业级舆情监测与智能处置系统
开发语言·人工智能
AI即插即用23 分钟前
即插即用系列 | AAAI 2026 WaveFormer: 当视觉建模遇上波动方程,频率-时间解耦的新SOTA
图像处理·人工智能·深度学习·神经网络·计算机视觉·视觉检测
轻览月24 分钟前
【DL】复杂卷积神经网络Ⅰ
人工智能·神经网络·cnn
逄逄不是胖胖32 分钟前
《动手学深度学习》-55-2RNN的简单实现
人工智能·深度学习
冰菓Neko34 分钟前
科目四刷题总结
人工智能
guizhoumen35 分钟前
2026年建站系统推荐及选项指南
大数据·运维·人工智能
咚咚王者41 分钟前
人工智能之核心技术 深度学习 第四章 循环神经网络(RNN)与序列模型
人工智能·rnn·深度学习
蘑菇物联44 分钟前
蘑菇物联入选“预见·2026”年度双榜,以AI技术赋能制造业绿色转型!
大数据·人工智能
无忧智库1 小时前
智慧城市核心标准全景解析:从顶层设计到落地实践的深度解读(PPT)
人工智能·智慧城市