图像插值算法
图像插值在图像处理中常用于调整图像尺寸或变形,其目标是根据给定像素点周围像素点的信息来预测该像素点的值。
常见的图像插值算法可以分为两类:自适应和非自适应。自适应的方法可以根据插值内容的特点来进行调整,而非自适应的方法对所有像素点都进行相同的处理。非自适应算法包括最近邻插值 、双线性插值 、双三次插值 、样条插值 、sinc插值 和lanczos插值等。这些算法可以根据需要调整插值的精度和计算复杂度,以实现图像的扭曲和缩放。
最近邻插值
最近邻插值是一种简单的插值方法,它选择离目标点最近的已知点的值作为新插入点的值。当源图像大小为 S r c W i d t h SrcWidth SrcWidth和 S r c H e i g h t SrcHeight SrcHeight,目标图像大小为 D s t W i d t h DstWidth DstWidth和 D s t H e i g h t DstHeight DstHeight,或者涨缩比例为 S x S_x Sx和 S y S_y Sy,则计算目标图像任意像素横纵坐标 d s t x dst_x dstx和 d s t y dst_y dsty如下:
- 如果 S x S_x Sx和 S y S_y Sy均为0,则先计算 S x S_x Sx和 S y S_y Sy
S x = r o u n d ( D s t W i d t h / S r c W i d t h ) S_{x}=round(DstWidth/SrcWidth) Sx=round(DstWidth/SrcWidth) //水平涨缩比例
S y = r o u n d ( D s t H e i g h t / S r c H e i g h t ) S_{y}=round(DstHeight/SrcHeight) Sy=round(DstHeight/SrcHeight) //竖直涨缩比例 - 计算目标图像->源图像的涨缩比例
S x i n v = 1. / S x S_{xinv}=1./S_x Sxinv=1./Sx //反水平涨缩比例
S y i n v = 1. / S y S_{yinv}=1./S_y Syinv=1./Sy //反竖直涨缩比例 - 计算目标像素在源图像中的坐标,注意边界条件
d s t x = r o u n d ( s r c x ∗ S x i n v ) dst_x=round(src_x*S_{xinv}) dstx=round(srcx∗Sxinv) //水平坐标
d s t y = r o u n d ( s r c y ∗ S y i n v ) dst_y=round(src_y*S_{yinv}) dsty=round(srcy∗Syinv) //竖直坐标 - 计算目标图像像素值
I D s t ( x , y ) = I S r c ( d s t x , d s t y ) I_{Dst}(x,y)=I_{Src}(dst_x,dst_y) IDst(x,y)=ISrc(dstx,dsty)
双线性插值
双线性插值则是在两个方向上进行线性插值,通过对四个最近的已知点进行加权平均来确定新插入点的值,如下图所示,点P为目标图像任意像素坐标通过一定的涨缩比例变换至源图像的坐标位置,计算方式如下:
- 利用上述最近邻方法,计算目标图像像素坐标在源图像中的坐标位置
- 计算坐标偏差
点P坐标 ( x , y ) (x,y) (x,y), t , u t,u t,u为小数部分坐标, t = x − x 0 , u = y − y 0 t=x-x0,u=y-y0 t=x−x0,u=y−y0 - 先计算水平方向
Q1,Q2线性插值: I Q 11 = I ( x 0 , y 0 ) ∗ ( 1 − t ) + I ( x 1 , y 0 ) ∗ t I_{Q11} = I(x_0,y_0) * (1-t) + I(x_1, y_0) * t IQ11=I(x0,y0)∗(1−t)+I(x1,y0)∗t
Q3,Q4线性插值: I Q 22 = I ( x 0 , y 1 ) ∗ ( 1 − t ) + I ( x 1 , y 1 ) ∗ t I_{Q22} = I(x_0, y_1) * (1-t) + I(x_1,y_1) *t IQ22=I(x0,y1)∗(1−t)+I(x1,y1)∗t - 利用Q11, Q22的值,进行垂直方向权重计算得出计算采样点值
I D s t ( x , y ) = I Q 11 ∗ ( 1 − u ) + I Q 22 ∗ u I_{Dst}(x,y) = I_{Q11}*(1-u) + I_{Q22} * u IDst(x,y)=IQ11∗(1−u)+IQ22∗u
双三次插值
双三次插值则是在两个方向上进行三次插值,通过对16个最近的已知点进行加权平均来确定新插入点的值。待补充算法。
OpenCV函数
void cv::resize(InputArray src, OutputArray dst, Size dsize, double fx = 0, double fy = 0, int interpolation = INTER_LINEAR)
Parameters
src 输入图像;
dst 输出图像,其大小为dsize(当它非零时)或由src.size()、fx和fy计算得到的大小,类型与src相同;
dsize 输出图像尺寸,如果它等于0(在Python中为None),则计算为:dsize = Size(round(fx*src.cols), round(fy*src.rows)),dsize或者fx和fy都必须非零。
fx 水平轴比例因子,当它等于0时,计算为(double)dsize.width/src.cols
fy 纵轴比例因子,当它等于0时,计算为(double)dsize.height/src.rows
interpolation 插值方式, 见InterpolationFlags
InterpolationFlags
- INTER_NEAREST :最近邻插值
- INTER_LINEAR :双线性插值
- INTER_CUBIC :双立方插值
- INTER_AREA :利用像素面积关系进行重采样。它可能是图像抽取的首选方法,因为它可以得到与莫尔无关的结果。但当图像被放大时,它类似于INTER_NEAREST方法。
- INTER_LANCZOS4 :8x8邻域上的LANCZOS4插值
- INTER_LINEAR_EXACT :位精确双线性插值
- INTER_NEAREST_EXACT :位精确近邻插值。这将产生与PIL、scikit-image或Matlab中的最近邻方法相同的结果。
- INTER_MAX :插值掩码
- WARP_FILL_OUTLIERS :标志,填充目标图像的所有像素。如果其中一些对应于源图像中的异常值,则将其设置为零
- WARP_INVERSE_MAP :标志,逆变换,例如, linearPolar or logPolar 两种变化:flag is not set: dst(ρ,ϕ)=src(x,y);flag is set: dst(x,y)=src(ρ,ϕ);