ECCV 2024 | 加速图像超分辨率网络的像素级分类

题目:Accelerating Image Super-Resolution Networks with Pixel-Level Classification
加速图像超分辨率网络的像素级分类
作者:Jinho Jeong, Jinwoo Kim, Younghyun Jo, Seon Joo Kim
论文链接:https://arxiv.org/abs/2407.21448
源码链接:https://github.com/3587jjh/PCSR

论文创新点

  1. 像素级分类器(Pixel-level Classifier) :作者提出了一种名为单图像超分辨率的像素级分类器(PCSR)的新方法,这种方法能够在像素级别动态分配计算资源,与传统的基于块的方法相比,能够更精细地处理图像中不同区域的恢复难度。

  2. 自适应资源分配 :PCSR模型包括一个主干网络、一个像素级分类器和一组不同容量的像素级上采样器。这种方法允许在推理过程中在性能和计算成本之间进行平衡,而无需重新训练

  3. 多尺度超分辨率(Multi-scale Super-Resolution):利用LIIF作为上采样器,PCSR模型能够适应不同的尺度因子,这意味着只需要一个模型就能处理多种尺度的超分辨率任务,这与传统方法需要为每个尺度因子单独建模相比,是一个显著的优势。

摘要

近年来,对于有效的超分辨率(SR)技术的需求激增,尤其是对于从2K到8K分辨率的大规模图像。对于基于深度神经网络(DNN)的单图像超分辨率(SISR),由于计算限制,通常需要将图像分解成重叠的块。在这样的块分解方案中,可以根据每个块的难度不同分配计算资源以进一步提高效率,同时保持SR性能。然而,这种方法有一个局限性:在块内均匀分配计算资源,导致包含不同恢复难度像素的块效率降低。为了解决这个问题,我们提出了一种新的方法,称为单图像超分辨率的像素级分类器(PCSR),它旨在自适应地在像素级别分配计算资源。PCSR模型包括一个主干网络、一个像素级分类器和一组不同容量的像素级上采样器。像素级分类器根据其恢复难度将每个像素分配给适当的上采样器,从而优化计算资源的使用。我们的方法允许在推理过程中在性能和计算成本之间平衡,而无需重新训练。我们的实验表明,PCSR在不同背景模型和基准测试中的PSNR-FLOP权衡方面比现有的块分配方法具有优势。

关键词

图像超分辨率、深度学习、像素级分类、计算资源分配

3. 方法

3.1 网络架构

PCSR的概述如图3所示。基于我们之前的讨论,模型由主干网络和一组上采样器组成。此外,我们采用了一个分类器,用于测量HR空间中目标像素的恢复难度。LR输入图像被前馈到主干网络并生成相应的LR特征图。然后,分类器确定每个查询像素的恢复难度,并通过相应的上采样器计算其输出RGB值。

主干网络

我们提出了一种用于高效大图像SR的逐像素计算分配方法。可以使用任何现有的深度SR网络作为我们的主干网络,以适应所需的模型大小。例如,小尺寸的FSRCNN、中等尺寸的CARN、大尺寸的SRResNet,以及其他模型也可以采用。

分类器
上采样器

3.2 训练

4. 实验

相关推荐
灵途科技7 小时前
灵途科技当选中国电子商会智能传感器专委会副理事长单位
大数据·人工智能·科技
非著名架构师7 小时前
“低空经济”的隐形护航者:AI驱动的秒级风场探测如何保障无人机物流与城市空管安全?
人工智能·数据分析·疾风气象大模型·高精度天气预报数据·galeweather.cn·高精度气象
洁洁!8 小时前
openEuler在WSL2中的GPU加速AI训练实战指南
人工智能·数据挖掘·数据分析
桂花饼8 小时前
字节Seedream-4.5架构揭秘:当AI开始拥有“版式推理”能力,CISAN与DLE引擎如何重构多图生成?
人工智能·aigc·idea·sora2 api·gemini 3 pro·claude opus 4.5·doubao-seedream
whaosoft-1438 小时前
51c视觉~合集55
人工智能
AI营销快线8 小时前
2025年AI营销内容生产革命:成本减半,效率倍增的关键
人工智能
正在走向自律8 小时前
AiOnly平台x FastGPT:一键调用Gemini 3 Pro系列模型从零构建AI工作流
大数据·数据库·人工智能·aionly·nano banana pro·gemini 3 pro
沃斯堡&蓝鸟8 小时前
DAY22 推断聚类后簇的类型
人工智能·机器学习·聚类
老蒋新思维8 小时前
创客匠人 2025 万人峰会实录:AI 智能体重构创始人 IP 变现逻辑 —— 从 0 到年入千万的实战路径
大数据·网络·人工智能·tcp/ip·创始人ip·创客匠人·知识变现
这张生成的图像能检测吗8 小时前
(论文速读)MoE-Adapters++: 过动态混合专家适配器实现更有效的视觉语言模型的持续学习
人工智能·自然语言处理·视觉语言模型·持续学习