【前沿 热点 顶会】CVPR 2025 录用的与图像|视频恢复、抠图、超分辨率、3D生成有关的论文仅依赖于输入帧的无辅助的视频抠图方法通常难以处理复杂或模糊的背景。为了解决这个问题,我们提出了 MatAnyone,这是一个为目标分配的视频抠图量身定制的强大框架。具体来说,基于基于内存的范式,我们通过区域自适应内存融合引入了一个一致的内存传播模块,该模块自适应地集成来自前一帧的内存。这确保了核心区域的语义稳定性,同时保留了沿对象边界的精细细节。为了实现稳健的训练,我们提供了一个更大、高质量和多样化的视频抠图数据集。此外,我们还采用了一种新的训练策略,可以有效地利用大规模分割数据,提高抠图稳定性。借助这种