图像缩放因子的计算

文章目录

1.图像缩放

  视频缩放Scaler功能是图像处理中的一种常用功能,目的是将输入图像从一种分辨率转换到另一种分辨率输出,同时满足视频实时输入实时输出的要求。

  图像缩放存在方向性:分为水平方向缩放和垂直方向缩放。

在某个方向上,目标图的分辨率比原图的分辨率大,在这个方向上为图像放大。

在某个方向上,目标图的分辨率比原图的分辨率小,在这个方向上为图像缩小。

2.目标图与原图像素对应关系

  目标图的任意一个像素点都可以映射到原图某个特定的位置。缩放的过程就是利用原图相邻像素点计算出这个特定位置的像素点。

  举一个一维简单的例子:从4个像素放大到7个像素,位置映射关系如下。先讲过概念叫缩放因子,也叫缩放步进。缩放因子sf = 原图/目标图 = 4/7 = 0.5714,利用缩放因子对目标图像素位置累加就可以得到在原图中对应位置。


  两个概念区别:

缩放倍数sr = 目标图/原图 = 7/4 = 1.75(倍)

缩放因子sf = 1/sr = 原图/目标图 = 4/7 = 0.5714

  二维图像缩放就是在水平和垂直两个方向分别做映射。假设(x,y)为目标图像的像素坐标,(x',y')为原图像的像素坐标,ver_skfactor,hor_skfactor分别为垂直和水平方向缩放因子,那么由目标图像像素点在原图像中映射的位置计算公式如下。

x' = x * hor_skfactor

y' = y * ver_skfactor

  找到了在原图中对应像素位置,那接下来就是用插值算法进行计算。插值算法有很多,最近邻,双线性,双立方等等,本文不做讲述。

3.缩放因子计算公式

  上面提到了缩放因子,那么上面的计算方法是否正确呢?

  以上图4像素放大到像素为例,缩放因子sf = 原图/目标图 = 4/7 = 0.5714,结果目标图算到最后一个点对应原图位置是3.4285,超过了边界,感觉有问题。

  所以这里涉及到一个问题,就是缩放因子计算是应该是sf=vin/vout,还是sf=(vin-1)/(vout-1)?

  答案是要用sf=(vin-1)/(vout-1)这个公式。​

  原理:像素总数对应的是离散格点数,不是格子宽度。

W个图像像素可以理解为像素坐标:0 ~ W-1

首尾两个像素中心点,跨度是 W-1。

缩放是对像素跨度做映射,不是对像素个数。

  举个例子:

输入 1920 点:坐标 0,1,2,...,1919

总有效跨度:1920−1=1919

输出 960 点:

总跨度 960−1=959

  所以只有采用sf=(vin-1)/(vout-1)这个公式,才能保证以下效果。

· 输出第 0 点 → 映射输入第 0 点

· 输出最后一点 Wout​−1 → 严格映射输入最后一点 Win​−1

· 首尾严格对齐,整图线性无偏移、无拉伸、无越界

  我们再回过头对4像素放大到7像素例子做验证,sf = (4-1)/(7-1)=0.5,这样目标图最后一个点刚好也对应原图最后一个点。

相关推荐
韩师傅2 天前
海天线算法的前世今生
python·计算机视觉
韩师傅2 天前
当你的甲方设备过烂,要如何快速出效果?
python·计算机视觉
韩师傅2 天前
当你的甲方吐槽天空不够蓝,你应该如何应对
python·计算机视觉
兵慌码乱9 天前
基于 MediaPipe 与 PySide2 的手势交互音乐控制系统实现:轻量化视觉交互全流程解析
python·opencv·计算机视觉·人机交互·手势识别·mediapipe·pyside2
小小杨树11 天前
读懂色彩:拍照调色不再难
算法·计算机视觉·配色
H__Rick13 天前
自动对焦学习-3
人工智能·学习·计算机视觉
坏孩子的诺亚方舟13 天前
FPGA系统架构设计实践15_高云Arora V系列时钟体系
fpga开发·系统架构
计算机科研狗@OUC13 天前
(cvpr26) AIMDepth: Asymmetric Image-Event Mamba for Monocular Depth Estimation
人工智能·深度学习·计算机视觉
qq_3665665013 天前
2026最新:5款AI视频口型同步工具实测横评,视频翻译后嘴型对不上的终极解决方案
人工智能·计算机视觉·新媒体运营