图像缩放因子的计算

文章目录

1.图像缩放

视频缩放Scaler功能是图像处理中的一种常用功能,目的是将输入图像从一种分辨率转换到另一种分辨率输出,同时满足视频实时输入实时输出的要求。

图像缩放存在方向性:分为水平方向缩放和垂直方向缩放。

在某个方向上,目标图的分辨率比原图的分辨率大,在这个方向上为图像放大。

在某个方向上,目标图的分辨率比原图的分辨率小,在这个方向上为图像缩小。

2.目标图与原图像素对应关系

目标图的任意一个像素点都可以映射到原图某个特定的位置。缩放的过程就是利用原图相邻像素点计算出这个特定位置的像素点。

举一个一维简单的例子:从4个像素放大到7个像素,位置映射关系如下。先讲过概念叫缩放因子,也叫缩放步进。缩放因子sf = 原图/目标图 = 4/7 = 0.5714,利用缩放因子对目标图像素位置累加就可以得到在原图中对应位置。


两个概念区别:

缩放倍数sr = 目标图/原图 = 7/4 = 1.75(倍)

缩放因子sf = 1/sr = 原图/目标图 = 4/7 = 0.5714

二维图像缩放就是在水平和垂直两个方向分别做映射。假设(x,y)为目标图像的像素坐标,(x',y')为原图像的像素坐标,ver_skfactor,hor_skfactor分别为垂直和水平方向缩放因子,那么由目标图像像素点在原图像中映射的位置计算公式如下。

x' = x * hor_skfactor

y' = y * ver_skfactor

找到了在原图中对应像素位置,那接下来就是用插值算法进行计算。插值算法有很多,最近邻,双线性,双立方等等,本文不做讲述。

3.缩放因子计算公式

上面提到了缩放因子,那么上面的计算方法是否正确呢?

以上图4像素放大到像素为例,缩放因子sf = 原图/目标图 = 4/7 = 0.5714,结果目标图算到最后一个点对应原图位置是3.4285,超过了边界,感觉有问题。

所以这里涉及到一个问题,就是缩放因子计算是应该是sf=vin/vout,还是sf=(vin-1)/(vout-1)?

答案是要用sf=(vin-1)/(vout-1)这个公式。​

原理:像素总数对应的是离散格点数,不是格子宽度。

W个图像像素可以理解为像素坐标:0 ~ W-1

首尾两个像素中心点,跨度是 W-1。

缩放是对像素跨度做映射,不是对像素个数。

举个例子:

输入 1920 点:坐标 0,1,2,...,1919

总有效跨度:1920−1=1919

输出 960 点:

总跨度 960−1=959

所以只有采用sf=(vin-1)/(vout-1)这个公式,才能保证以下效果。

· 输出第 0 点 → 映射输入第 0 点

· 输出最后一点 Wout​−1 → 严格映射输入最后一点 Win​−1

· 首尾严格对齐,整图线性无偏移、无拉伸、无越界

我们再回过头对4像素放大到7像素例子做验证,sf = (4-1)/(7-1)=0.5,这样目标图最后一个点刚好也对应原图最后一个点。

相关推荐
m0_617493944 小时前
OpenCV报错解决:cornerSubPix断言失败 src.channels() == 1 的终极指南
人工智能·opencv·计算机视觉
搬砖者(视觉算法工程师)6 小时前
计算机视觉与计算摄影测量学第三讲图像直方图:理论、统计特性与点运算变换
人工智能·算法·计算机视觉
不懒不懒9 小时前
【基于 YOLOv10 与 PyQt5 的汽车零件缺陷检测系统实战开发】
人工智能·计算机视觉·目标跟踪
ZPC82109 小时前
moveit2_servo 怎么接收相机调节指令(视觉伺服)
人工智能·数码相机·算法·计算机视觉·机器人
AI人工智能+10 小时前
基于OCR与深度学习的发票识别技术,重构报销系统效率
计算机视觉·自然语言处理·ocr·发票识别
勤自省10 小时前
ROS2 + OpenCV 实战教程:人脸识别、物体跟踪、ArUco 二维码识别初级
人工智能·opencv·ubuntu·计算机视觉·ros2
XINVRY-FPGA10 小时前
XC7Z010-2CLG400I Xilinx Zynq-7000 FPGA
arm开发·嵌入式硬件·算法·fpga开发·硬件工程·dsp开发·fpga
8K超高清11 小时前
2026传媒技术大会:博冠赋能融媒体制播
大数据·人工智能·科技·数码相机·计算机视觉·传媒·媒体
XINVRY-FPGA11 小时前
XCZU11EG-2FFVC1156I Xilinx Zynq UltraScale+ MPSoC EG FPGA
图像处理·嵌入式硬件·计算机视觉·fpga开发·硬件工程·dsp开发·fpga