CVPR2023新作:基于组合空时位移的视频修复

  1. Title: A Simple Baseline for Video Restoration With Grouped Spatial-Temporal Shift (视频修复的简单基准:组合空时位移)

  2. Affiliation: CUHK MMLab (香港中文大学多媒体实验室)

  3. Authors: Dasong Li, Xiaoyu Shi, Yi Zhang, Ka Chun Cheung, Simon See, Xiaogang Wang, Hongwei Qin, Hongsheng Li

  4. Keywords: video restoration, inter-frame information, deep learning, spatial-temporal shift, effective receptive field

  5. Summary:

  • (1): 该文章研究视频修复,
  • (2): 过去的方法通常依赖于复杂的网络架构,例如:光流估计,可变形卷积和跨帧自注意力,这些方法会带来高额的计算成本。而本文提出的轻量级框架------基于组合空时位移的方法,能够隐含地捕捉多帧间的对应关系,并且可以扩展有效的感受野,同时使用基本的二维卷积聚合不同帧间的信息,相对于之前的方法可节约75%的计算成本。
  • (3): 该算法的核心是组合空时位移块,可以有效地实现大尺度的有效感受野。
  • (4): 在视频去模糊和视频降噪两个任务上,该方法均表现优于之前的最先进方法,证明了该方法可以在保持高质量结果的同时大大减少计算开销。
  1. Methods:
  • (1): 本文提出了一种轻量级的视频修复框架,利用组合空时位移块来捕捉多帧间的对应关系,并扩展有效感受野。其中,组合空时位移块通过局部位移和空间注意机制对输入进行建模,并通过平均池化和最大池化来聚合特征,并利用反卷积恢复图像细节。

  • (2): 该算法分为两个关键步骤:(i) 异质帧间信息聚合;(ii) 异质帧间信息修改。其中,第一步采用组合空时位移块实现,可以有效地扩展有效感受野;第二步则通过反卷积层实现。

  • (3): 文中提到,该方法可以节省75%的计算成本。实验结果表明,该算法在视频去模糊和视频降噪两个任务上均优于之前的最先进方法,证明了该方法的有效性和实用性。

  1. Conclusion:
  • (1): 本文提出了一种简单而有效的视频修复框架。通过引入轻量级的组合空时位移块,该方法可以隐含地捕捉多帧间的对应关系,同时扩展有效的感受野,大大减少计算成本。该方法在视频去模糊和降噪任务上具有更好的表现。
  • (2): 创新点:通过组合空时位移块实现了多帧间对应关系的建模,扩展了有效感受野,优化了计算成本。性能:在视频去模糊和降噪任务上表现优于之前最先进的方法。工作负荷:可以节省75%的计算成本。
相关推荐
Master_oid10 分钟前
机器学习21:可解释机器学习(Explainable Machine Learning)(上)
人工智能·机器学习
MobotStone20 分钟前
边际成本趋近于零:如何让AI智能体"说得清、讲得明"
人工智能·架构
ACP广源盛1392462567334 分钟前
GSV6505F---1 In to 4 Out HDMI 2.1 Splitter with Embedded MCU
单片机·嵌入式硬件·音视频
新智元35 分钟前
李飞飞「世界模型」正式开放,人人可用! Pro 版首月仅 7 元
人工智能·openai
新智元38 分钟前
GPT-5.1 凌晨突袭,奥特曼听劝!全网呼唤的人味回来了
人工智能
钅日 勿 XiName43 分钟前
一小时速通Pytorch之自动梯度(Autograd)和计算图(Computational Graph)(二)
人工智能·pytorch·python
化作星辰1 小时前
深度学习_神经网络中最常用的学习率优化算法
深度学习·神经网络·学习
拓端研究室1 小时前
专题:2025中国医疗器械出海现状与趋势创新发展研究报告|附160+份报告PDF、数据、可视化模板汇总下载
大数据·人工智能·pdf
算家计算1 小时前
PaddleOCR-VL-vLLM-OpenAI-API使用教程来了!手把手教你搞定文档解析
人工智能·开源
算家计算1 小时前
GPT-5.1深夜发布却无惊喜?从GPT-5.1看大模型发展瓶颈
人工智能·chatgpt·openai