【计算机视觉--解耦视频分割跟踪任何物体】

UIUC&Adobe开源|无需监督,使用解耦视频分割跟踪任何物体!视频分割的训练数据往往昂贵且需要大量的标注工作。这限制了将端到端算法扩展到新的视频分割任务,特别是在大词汇量的情况下。为了在不为每个个别任务训练视频数据的情况下实现"跟踪任何物体",开发了一种解耦视频分割方法(DEVA),包括任务特定的图像级分割和类/任务无关的双向时间传播。由于这种设计,只需要为目标任务训练一个图像级别的模型(这更便宜),以及一个通用的时间传播模型,只需训练一次即可适用于多个任务。为了有效地结合这两个模块,使用双向传播来对来自不同帧的分割假设进行(半)在线融合,以生成一致的分割结果。展示了这种解耦的方法在多个数据稀缺任务中表现出色,包括大词汇量视频全景分割、开放世界视频分割、指代视频分割和无监督视频对象分割。

项目主页:https://hkchengrex.com/Tracking-Anything-with-DEVA/

论文地址:https://arxiv.org/abs/2309.03903

代码地址:https://github.com/hkchengrex/Tracking-Anything-with-DEVA

相关推荐
俊哥V12 小时前
每日 AI 研究简报 · 2026-05-15
人工智能·ai
数智工坊12 小时前
【BLIP-2论文阅读】:冻结预训练模型的多模态预训练革命
论文阅读·人工智能·深度学习·计算机视觉·transformer
专注VB编程开发20年13 小时前
TRAE 稳定不排队、避开 “人满 / 没钱限流” 完整方案(实测有效)
ide·人工智能
zzzzzz31013 小时前
GenericAgent 深度解析:3K行代码如何实现自我进化智能体
人工智能
夫唯不争,故无尤也13 小时前
深度学习优化器:AdamW与SGD的区别
人工智能·深度学习
沉浸式学习ing13 小时前
B站视频怎么快速总结?AI自动生成要点+思维导图+逐字稿
人工智能·ai·自然语言处理·音视频·语音识别·notion
风止何安啊13 小时前
用 APP 背单词太无聊?我用 Trae Solo 移动端写个小游戏来准备 6级
前端·人工智能·trae
石榴树下的七彩鱼13 小时前
AI图像修复技术深度解析:超分辨率、去模糊与上色原理详解(附论文精读+实践指南)
人工智能·深度学习·计算机视觉·超分辨率·石榴智能·ai图像修复
OceanBase数据库官方博客13 小时前
OceanBase seekdb-cli:专为 AI Agent 设计的数据库接口
数据库·人工智能·oceanbase
MatrixOrigin13 小时前
什么是AI Native的组织,它该具备什么样的特点
人工智能·ai·opc