《计算机视觉中的多视图几何》笔记(13)

13 Scene planes and homographies

本章主要讲述两个摄像机和一个世界平面之间的射影几何关系。

我们假设空间有一平面 π \pi π,平面上的一点为 x π x_{\pi} xπ。 x π x_{\pi} xπ分别在两幅图像 P , P ′ P, P' P,P′上形成了 x , x ′ x, x' x,x′。

那么我们可以从两个方面来讨论:首先,从对极几何的角度来说, x x x在 P ′ P' P′上决定了一条直线,也就是极线。极线是由 x x x出发的射线在 P ′ P' P′上投影形成的。第二,从homography角度来说, x x x可以在 P ′ P' P′上唯一确定一个点,因为从 x x x出发的射线和空间平面 π \pi π的交点可以求出来,也就是 x π x_{\pi} xπ,知道了 x π x_{\pi} xπ自然可以唯一确定 x ′ x' x′。

文章目录

  • [13 Scene planes and homographies](#13 Scene planes and homographies)
    • [13.1 Homographies given the plane and vice versa](#13.1 Homographies given the plane and vice versa)
      • [13.1.1 Homographies compatible with epipolar geometry](#13.1.1 Homographies compatible with epipolar geometry)
    • [13.2 Plane induced homographies given F F F and image correspondences](#13.2 Plane induced homographies given F F F and image correspondences)
      • [13.2.1 Three points](#13.2.1 Three points)
      • [13.2.2 A point and line](#13.2.2 A point and line)
    • [13.3 Computing F F F given the homography induced by a plane](#13.3 Computing F F F given the homography induced by a plane)
    • [13.4 The infinite homography H ∞ H_{\infin} H∞](#13.4 The infinite homography H ∞ H_{\infin} H∞)

13.1 Homographies given the plane and vice versa

现在我们来讨论一下单应性与平面之间的关系。空间内任意的一个平面可以唯一确定单应性,反之亦然。需要注意的是,空间内的平面不可以包括摄像机的光心,如果包括了光心,单应性就变成了退化的情况。

我们首先给出一个结论:

假设两个摄像机的投影矩阵分别是 P = [ I ∣ 0 ] , P ′ = [ A ∣ a ] P=[I|0],P'=[A|a] P=[I∣0],P′=[A∣a],空间内的平面表示为 π T X = 0 , π = ( V T , 1 ) \pi^T X = 0, \pi=(V^T, 1) πTX=0,π=(VT,1),由该平面确定的单应性就是 x ′ = H x x'=Hx x′=Hx,并且 H = A − a v T H = A-av^T H=A−avT。

13.1.1 Homographies compatible with epipolar geometry

单应性与对极几何的关系。假设我们从空间平面上随机选择4个点,把他们投影到两幅图像,就会形成4对对应点。这4对对应点就确定了一个单应性矩阵 H H H。而且这4对对应点是满足对极几何约束的,i.e. x ′ T F x = 0 x'^T F x = 0 x′TFx=0。这种情况叫对极几何与单应性是相容(consistent or compatible)的。

假设我们从第一幅图像中随机选择四个点,第二幅图像也随机选四个点,可以利用它们计算出一个单应性矩阵,不一定能满足对极几何的约束,这种情况叫对极几何与单应性不相容。

现在我们考虑相容的情况。那么对应点之间可以表示为 x ↔ H x x \leftrightarrow Hx x↔Hx,带入对极几何的关系式,我们就得到 ( H x ) T F x = x T H T F x = 0 (Hx)^T F x = x^T H^T Fx = 0 (Hx)TFx=xTHTFx=0。

根据此式我们可以得出一个结论:

单应性矩阵 H H H与基本矩阵 F F F相容当且仅当 H T F H^T F HTF是一个斜对称矩阵(skew-symmetric),我们将其表达为: H T F + F T H = 0 H^T F + F^T H =0 HTF+FTH=0, H H H的自由度是8-5=3。

由于以上关系是一个隐性的约束,我们接下来给出一个显式表达式。

结论 13.3

给出由两幅图像确定的基本矩阵 F F F,其对应的单应性矩阵 H H H可以表示为 H = A − e ′ V T H=A-e'V^T H=A−e′VT F = [ e ′ ] × A F=[e']_\times A F=[e′]×A。

引理 13.4

一个变换 H H H是两幅图像的单应矩阵当且仅当这两幅图像确定的 F F F可以分解成 [ e ′ ] × H [e']_\times H [e′]×H, e ′ e' e′是第二幅图像的极点。

根据以上介绍,我们知道单应性矩阵 H H H是由空间内某一平面 π \pi π确定的,那么在已知 H H H的情况下,我们如何求出平面 π \pi π?求解方程组 λ H = A − a v T \lambda H=A-av^T λH=A−avT就行。

13.2 Plane induced homographies given F F F and image correspondences

从基本矩阵和图像对应点来计算单应性矩阵。在前文我们是利用空间中的平面来计算单应性矩阵,在本节中我们直接从两幅图像中的对应元素来计算单应性矩阵。这是因为三维空间的平面可以用三个不共线的点来计算,或者用一条直线和一个点。这些元素都可以直接从两幅图中的对应元素推导出来。对应元素应该满足一些性质:

  1. 对应元素要满足对极几何的约束
  2. 三维空间中的元素会出现退化的情况,这是因为元素之间共面或者共线

我们首先讨论从三个对应点来计算单应性矩阵的情况。

13.2.1 Three points

假设我们知道空间中的三个点 X i X_i Xi在两幅图像上形成的投影,并且我们已知基本矩阵 F F F,我们可以这样计算单应矩阵 H H H:

首先空间点 X i X_i Xi的坐标可以计算出来(12章的三角化),知道了三个点的位置,那么它们所在的平面就可以被计算出来(3.3-P66),已知平面就可以根据13.1节的方法来计算 H H H,这种方法叫显式法。

其次,我们也可以用四个点来计算 H H H,第四个点就是极点。所以我们可以有这样的方程组: x ′ = H x , e ′ = H e x'=Hx, e'=He x′=Hx,e′=He,这种方法叫隐式法。

那么这两种方法有啥区别?我们应该用哪一种?答案是我们应该用显示法,因为隐式法包含了退化的情况。为什么呢?因为如果有两个点和极点共线,那么 H H H就算不出来了,参见4.1.3 P91。同时,如果点和极点几乎共线,那么隐式法会给出一个非常差的结果,但是显式法没有这个问题,它可以处理点和极点共线的情况。

我们下面来形式化的表示一下。

结论13.6 给定一个基本矩阵 F F F和三对对应点 x i ↔ x i ′ x_i \leftrightarrow x'_i xi↔xi′,由这三对点所在平面构成的 H H H可以表达为: H = A − e ′ ( M − 1 b ) T H=A-e'(M^{-1}b)^T H=A−e′(M−1b)T。

A = [ e ′ ] × F A=[e']_\times F A=[e′]×F b b b是一个三维向量,每一维可以表达成:

b i = ( x i ′ × ( A x i ) ) T ( x i ′ × e ′ ) / ∣ ∣ x i ′ × e ′ ∣ ∣ 2 b_i = (x'_i \times (Ax_i))^T (x'_i \times e')/||x'_i \times e'||^2 bi=(xi′×(Axi))T(xi′×e′)/∣∣xi′×e′∣∣2

M M M是 3 × 3 3 \times 3 3×3的矩阵, 每一行是 x i T x_i^T xiT。

一致性条件 每一对对应点都会对 H H H增加一个约束,该约束可以表达为: e ′ × x i ′ = e ′ × A x i = F x i e' \times x'_i = e' \times Ax_i = Fx_i e′×xi′=e′×Axi=Fxi,这个等式左边 e ′ × x i ′ e' \times x'_i e′×xi′的几何意义是通过 x i ′ x'_i xi′的极线,右边 F x i F x_i Fxi就是 x i x_i xi在第二幅图像中的极线。所以整个式子的意思就是 x i ′ x'_i xi′在 x i x_i xi对应的极线上。

存在噪声的情况 一般情况下图像中都包含噪声,那么我们就用迭代的方法来优化 x , x ′ x,x' x,x′的位置(12.1节P318),然后用12.6节的极大似然估计来求3D空间点的坐标和 H H H。

13.2.2 A point and line

点和线来估计 H H H。本节先将线对应关系,再讲点对应关系。

线对应 两幅图像中的对应线确定了三维空间中的一条对应线。三维空间中的线位于一族平面上(不是一个平面)。这一族平面对应于一族 H H H。

结论 13.7 由一对对应直线 l ↔ l ′ l \leftrightarrow l' l↔l′ 确定的一族平面对应了一族单应性矩阵 H H H,它可以表达为

H ( μ ) = [ l ′ ] × F + μ e ′ l T H(\mu) = [l']_{\times} F + \mu e'l^T H(μ)=[l′]×F+μe′lT

从这个式子我们可以看出, H H H只取决于 μ \mu μ这一个参数。我们回忆一下13.1节, H H H同样有一个表达式,该表达式是在已知两个摄像机矩阵 P = K [ I ∣ 0 ] , P ′ = K ′ [ R ∣ t ] P=K[I|0],P'=K'[R|t] P=K[I∣0],P′=K′[R∣t] 和空间平面 π = ( n T , d ) T \pi=(n^T,d)^T π=(nT,d)T的情况下给出的。

H = K ′ ( R − t n T / d ) K − 1 H=K'(R-tn^T/d)K^{-1} H=K′(R−tnT/d)K−1

这个式子由三个参数决定,因为 n T n^T nT是一个三维向量。对比上文的两个式子,我们可以看出由直线确定的 H H H只需要一个参数,由平面确定的 H H H需要三个参数,也就是说直线将参数的维度从3压缩到了1。

线和点的对应 从上文我们知道线对应关系可以确定 H ( μ ) H(\mu) H(μ),那么怎么确定 μ \mu μ的取值呢?我们用点对应 x ↔ x ′ x \leftrightarrow x' x↔x′ 来确定。

结论13.8 已知 F F F和一对对应点 x ↔ x ′ x \leftrightarrow x' x↔x′,一对对应线 l ↔ l ′ l \leftrightarrow l' l↔l′, H H H可以表达为如下式子:

H = [ l ′ ] × F + ( x ′ × e ′ ) T ( x ′ × ( ( F x ) × l ′ ) ) ∣ ∣ x ′ × e ′ ∣ ∣ 2 ( l T x ) e ′ l T H=[l']_{\times} F + \frac{(x' \times e')^T(x' \times ((Fx) \times l'))} {||x' \times e'||^2 (l^Tx)} e'l^T H=[l′]×F+∣∣x′×e′∣∣2(lTx)(x′×e′)T(x′×((Fx)×l′))e′lT

应用这个公式的前提是 x , x ′ x, x' x,x′得满足对极几何约束,那么在有噪声的情况下,我们首先就得用算法12.1(P318)先优化一下。

H ( μ ) H(\mu) H(μ)的几何解释
H ( μ ) H(\mu) H(μ)首先满足 x = H ( μ ) x ′ x=H(\mu)x' x=H(μ)x′。我们将 H ( μ ) H(\mu) H(μ)的表达式带入,可以得到:
x ′ = H ( μ ) x = ( [ l ′ ] × F + μ e ′ l T ) x = [ l ′ ] × F x x'=H(\mu)x = ([l']{\times} F + \mu e'l^T)x = [l']{\times}Fx x′=H(μ)x=([l′]×F+μe′lT)x=[l′]×Fx

最后得到的结果跟 μ \mu μ没关系,只和 F F F有关系。所以我们说对极几何为 l ↔ l ′ l \leftrightarrow l' l↔l′上的每一点都确定了对应关系。这个结论很显然。因为 F F F本来就是描述两幅图像上点对应关系的,只不过现在的点都在 l , l ′ l, l' l,l′上了。

退化的单应矩阵 如果说三维空间中的平面包括了摄像机的光心,那么 H H H就属于退化的情况。在退化情况下 H H H就不是满秩矩阵,如果 r a n k ( H ) = 2 rank(H)=2 rank(H)=2, H H H投影结果就是一条直线。 r a n k ( H ) = 1 rank(H) = 1 rank(H)=1, H H H投影结果就是一个点。如果我们从 H ( μ ) H(\mu) H(μ)的情况考虑,那么退化就可以表达成 μ → inf ⁡ \mu \rightarrow \inf μ→inf或者 μ → 0 \mu \rightarrow 0 μ→0。

13.3 Computing F F F given the homography induced by a plane

我们讨论如何在已知 H H H的情况下求解 F F F。前几章我们讲述的是已知 F F F,怎么求解 H H H。现在我们反过来,求已知 H H H的情况下,如何求解 F F F。

主要思路就是构造一个平面 π \pi π, X X X不在 π \pi π上。那么 x x x和 π \pi π有一个交点 x π x_{\pi} xπ,该交点向 P ′ P' P′投影,得到 x ~ ′ \tilde{x}' x~′。 x ~ ′ \tilde{x}' x~′肯定和 x ′ x' x′不一样,除非 X X X在 π \pi π上。那么我们用 x ~ ′ , x ′ \tilde{x}', x' x~′,x′做叉乘,得到的线段肯定过极点 e ′ e' e′,再找另外一个 x ~ ′ \tilde{x}' x~′,重复一遍,就得到第二条过极点 e ′ e' e′的极线,两个极线交点就是极点 e ′ e' e′,知道了 e ′ e' e′,就可以用 [ e ′ ] × H = F [e']_{\times} H =F [e′]×H=F求出 F F F。

所以最简单的办法就是找出6对对应点,其中有4对共面的。用这4对点来计算 H H H (求解方程组 x i ′ = H x i x'_i=Hx_i xi′=Hxi),然后用 x 5 , x 6 x_5,x_6 x5,x6求出两条直线 ( H x 5 ) × x 5 ′ (Hx_5) \times x'_5 (Hx5)×x5′, ( H x 6 ) × x 6 ′ (Hx_6) \times x'6 (Hx6)×x6′,两个直线做叉乘就是极点 e ′ e' e′, 所以 F = [ e ′ ] × H F=[e']{\times} H F=[e′]×H。

投影点的深度

一个世界平面内的点 X = ( x T , ρ ) T X=(x^T,\rho)^T X=(xT,ρ)T投影在第一幅图像上形成了 x x x,第二幅图像上形成了 x ′ = H x + ρ e ′ x'=Hx+\rho e' x′=Hx+ρe′,根据上一节的模型,我们知道 x ′ , e ′ H x x', e' Hx x′,e′Hx三点共线。 ρ \rho ρ可以被看做偏离 H H H相对程度的一个指标,那么它就可以被认为是 X X X与平面 π \pi π之间的距离。 ρ = 0 \rho=0 ρ=0表明 X X X在平面 π \pi π上 ρ \rho ρ的符号就可以表明 X X X位于平面的哪一边。

两个平面求F

假设我们知道两个平面 π 1 , π 2 \pi_1,\pi_2 π1,π2,那么他们确定两个单应矩阵 H 1 , H 2 H_1,H_2 H1,H2。这两个单应矩阵足以确定 F F F,其实他们是超定了。我们可以构造一个矩阵 H = H 2 H 1 H=H_2 H_1 H=H2H1,这是第一幅图像到自己的映射。那么极点 e e e在 H H H的映射下是不变的。那么 F = [ e ′ ] × H i , i = 1 , 2 , e ′ = H i e F=[e']_{\times} H_i, i=1,2, e'=H_ie F=[e′]×Hi,i=1,2,e′=Hie, H H H的另外一个性质是有相同的两个特征值。因为 H 1 , H 2 H_1,H_2 H1,H2在空间中会相交,然后形成一条直线。这个直线往第一幅图像中投影,得到的投影直线在 H H H的映射下是不变的。所以这个 H H H有一条固定的直线,还有一个固定点也就是极点 e e e。

13.4 The infinite homography H ∞ H_{\infin} H∞

无穷远处的单应矩阵。

定义 13.10 H ∞ H_{\infty} H∞ 是由无穷远处平面 π ∞ \pi_{\infty} π∞定义的单应矩阵。

我们回忆参数化的 H H H表达式 H = K ′ ( R − t n T / d ) K − 1 H=K'(R-tn^T/d)K^{-1} H=K′(R−tnT/d)K−1(由三个参数确定),那么
H ∞ = lim ⁡ d → ∞ H = K ′ R K − 1 H_{\infty} = \lim_{d \to \infty} H = K'RK^{-1} H∞=d→∞limH=K′RK−1

由上式可以看出 H ∞ H_{\infty} H∞ 并不依赖于图像之间的平移,只和旋转、内参有关系。

如果我们考虑两幅图之间对应的点,我们可以由下式:
x ′ = K ′ R K − 1 + K ′ t / Z = H ∞ x + K ′ t / Z x'=K'RK^{-1} + K't/Z = H_{\infty} x + K't/Z x′=K′RK−1+K′t/Z=H∞x+K′t/Z

Z Z Z就是点相对于第一幅图像的深度。从上式中我们可以看出无穷远处的点( z = ∞ z=\infty z=∞)是由 H ∞ H_{\infty} H∞映射到图像上的。如果平移 t t t是零,那么我们就可以得到 H ∞ H_{\infty} H∞,这相当与摄像机绕自己光心进行旋转。所以如果摄像机绕自己光心进行旋转,那么 H ∞ H_{\infty} H∞就是关于图像上任意深度点的一个单应矩阵。

如果我们考虑到 e ′ = K ′ t e'=K't e′=K′t那么 x ′ = H ∞ x + e ′ / z x'=H_{\infty}x+e'/z x′=H∞x+e′/z,我们对比书中式13.9
x ′ = H x + ρ e ′ x'=Hx+\rho e' x′=Hx+ρe′可以看出来 1 / z 1/z 1/z就相当于 ρ \rho ρ,所以说逆深度可以解释为点相对于无穷远平面 π ∞ \pi_{\infty} π∞的距离。

消失点和消失线

无穷远处平面上的点是由 H ∞ H_{\infty} H∞映射到图像上的,这些点就是消失点。所以 H ∞ H_{\infty} H∞在两幅图像中的消失点 v ′ , v v', v v′,v之间建立了映射 v ′ = H v v'=Hv v′=Hv,所以 H ∞ H_{\infty} H∞可以由三个不共线的消失点计算,也可以由对应的消失线计算(13.2.2节)。

仿射重建和度量重建

回忆chapter 10,知道了无穷远平面 π ∞ \pi_{\infty} π∞可以把投影重建升级成度量重建。 H ∞ H_{\infty} H∞会出现在重建过程中,因为我们如果指定 P = [ I ∣ 0 ] , P ′ = [ H ∞ ∣ λ e ′ ] P=[I|0],P'=[H_{\infty}|\lambda e'] P=[I∣0],P′=[H∞∣λe′],重建过程就是仿射重建。

假设我们规定 π ∞ \pi_{\infty} π∞的坐标是 ( 0 , 0 , 0 , 1 ) (0,0,0,1) (0,0,0,1), H ∞ H_{\infty} H∞可以直接从摄像机矩阵中来决定。我们假设 P = [ M ∣ 0 ] , P ′ = [ M ′ ∣ t ] P=[M|0], P'=[M'|t] P=[M∣0],P′=[M′∣t],那么无穷远平面上的一点 X = ( x ∞ T , 0 ) T X=(x^T_{\infty},0)^T X=(x∞T,0)T就会被映射到 x = P X = M x ∞ , x ′ = P ′ X = M ′ x ∞ x=PX=Mx_{\infty}, x'=P'X=M'x_{\infty} x=PX=Mx∞,x′=P′X=M′x∞,所以 x ′ = M ′ M − 1 x'=M'M^{-1} x′=M′M−1, 那么 H i n f t y = M ′ M − 1 H_{infty} = M'M^{-1} Hinfty=M′M−1。

H ∞ H_{\infty} H∞还可以被用来进行两个相机之间的标定。假设 π ∞ \pi_{\infty} π∞上的绝对圆 Ω ∞ \Omega_{\infty} Ω∞映射在两个图像上,分别表示为 ω , ω ′ \omega, \omega' ω,ω′,他们之间存在如下关系: ω ′ = H ∞ − T ω H ∞ − 1 \omega'=H_{\infty}^{-T} \omega H_{\infty}^{-1} ω′=H∞−TωH∞−1,那么我们如果知道 ω \omega ω,就可以计算 ω ′ \omega' ω′,然后分解它,就知道了第二个相机的内参。

立体匹配
H ∞ H_{\infty} H∞还可以用来缩小立体匹配时极线搜索的范围。因为 x x x和无穷远平面由一个交点,记为 X ∞ X_{\infty} X∞,它往图像二上投影,得到 x ∞ ′ x'{\infty} x∞′,那么与 x x x匹配的 x ′ x' x′肯定位于 e ′ e' e′与 x ∞ ′ x'{\infty} x∞′ 之间,所以我们不用搜索整个极线。

相关推荐
陈苏同学5 分钟前
4. 将pycharm本地项目同步到(Linux)服务器上——深度学习·科研实践·从0到1
linux·服务器·ide·人工智能·python·深度学习·pycharm
吾名招财23 分钟前
yolov5-7.0模型DNN加载函数及参数详解(重要)
c++·人工智能·yolo·dnn
m0_689618281 小时前
水凝胶发生器,不对称设计妙,医电应用前景广
笔记
Ace'1 小时前
每日一题&&学习笔记
笔记·学习
鼠鼠龙年发大财1 小时前
【鼠鼠学AI代码合集#7】概率
人工智能
龙的爹23331 小时前
论文 | Model-tuning Via Prompts Makes NLP Models Adversarially Robust
人工智能·gpt·深度学习·语言模型·自然语言处理·prompt
挥剑决浮云 -1 小时前
Linux 之 安装软件、GCC编译器、Linux 操作系统基础
linux·服务器·c语言·c++·经验分享·笔记
工业机器视觉设计和实现1 小时前
cnn突破四(生成卷积核与固定核对比)
人工智能·深度学习·cnn
我算是程序猿2 小时前
用AI做电子萌宠,快速涨粉变现
人工智能·stable diffusion·aigc