视觉图像坐标转换

1. 透镜成像

相机的镜头系统将三维场景中的光线聚焦到一个平面 (即传感器)。这个过程可以用小孔成像模型来近似描述,尽管实际相机使用复杂的透镜系统来减少畸变和提高成像质量。

小孔成像模型: 假设有一个理想的小孔,光线通过小孔后在对面形成倒立的实像

在小孔成像模型中,物体到小孔的距离 Z Z Z、焦距 f f f(小孔到成像平面的距离)、物体的实际尺寸 Y Y Y 和 X X X 以及物体在成像平面上的投影尺寸 y y y 和 x x x 之间的关系如下:

Z f = Y y = X x \frac{Z}{f} = \frac{Y}{y} = \frac{X}{x} fZ=yY=xX

其中,

  • Z Z Z 是物体到小孔的距离。
  • f f f 是焦距(小孔到成像平面的距离)。
  • Y Y Y 和 X X X 是物体的实际尺寸。
  • y y y 和 x x x 是物体在成像平面上的投影尺寸

这个模型假设有一个理想的小孔,光线通过小孔后在对面形成倒立的实像。虽然现实中没有完全理想的小孔,但这个模型有助于理解基本原理。

2. 相机内参数

内参数描述了相机的内部几何特性,包括焦距、主点位置、像素比例等 。这些参数通常通过相机标定过程获得,并用于将三维空间中的点投影到二维图像平面上。

三种坐标系的变换

2.1 主要内参数
  1. 焦距(Focal Length)

    • 通常用 f x f_x fx 和 f y f_y fy 表示,分别对应X轴和Y轴方向上的焦距。
    • 焦距决定了相机的视角和放大倍数。
  2. 主点(Principal Point)

    • 通常用 c x c_x cx 和 c y c_y cy 表示,表示光轴与成像平面的交点,即图像中心的像素坐标。
  3. 畸变系数(Distortion Coefficients)

    • 包括径向畸变(Radial Distortion)和切向畸变(Tangential Distortion)系数。
    • 这些系数用于校正镜头引起的图像失真。
2.2 内参数矩阵

内参数通常以一个3x3的矩阵 K K K 表示:

K = [ f x 0 c x 0 f y c y 0 0 1 ] K = \begin{bmatrix} f_x & 0 & c_x \\ 0 & f_y & c_y \\ 0 & 0 & 1 \end{bmatrix} K= fx000fy0cxcy1

其中:

  • f x f_x fx 和 f y f_y fy 是焦距(以像素为单位)。
  • c x c_x cx 和 c y c_y cy 是主点坐标(通常是图像中心)。
2.3 作用
  1. 投影变换:将三维空间中的点投影到二维图像平面上。
  2. 校正畸变:利用畸变系数校正图像中的失真现象,提高图像质量。

3. 外参数

外参数(Extrinsic Parameters)描述了相机相对于某个固定的世界坐标系的位置和姿态,包括旋转矩阵 R R R 和平移向量 t t t。 获取这些参数通常需要通过特定的方法或技术进行标定或估计。以下是几种常见的获取外参数的方法:

3.1 相机标定(Camera Calibration)

相机标定不仅用于获取内参数,还可以同时获得外参数 。常用的方法之一是使用已知几何结构的标定板(如棋盘格),通过多个视角拍摄标定板图像,然后利用这些图像来计算相机的内外参数

使用OpenCV进行相机标定

OpenCV 提供了一套完整的工具来进行相机标定,可以同时获取内参数和外参数。以下是一个简化的步骤说明:

  1. 准备标定板:使用一个已知尺寸的棋盘格作为标定板。
  2. 采集图像:从不同角度拍摄多张包含标定板的图像。
  3. 角点检测:在每张图像中找到棋盘格的角点位置。
  4. 标定过程:使用这些角点信息来计算相机的内外参数。
python 复制代码
import cv2
import numpy as np

def calibrate_camera(images, pattern_size=(9, 6)):
    """
    Calibrate the camera using a set of images with a known chessboard pattern.
    
    Parameters:
    - images: List of image paths containing the chessboard pattern.
    - pattern_size: Tuple (rows, cols) representing the number of inner corners per a chessboard row and column.
    
    Returns:
    - Intrinsic matrix K, distortion coefficients, rotation vectors, and translation vectors.
    """
    # Prepare object points, like (0,0,0), (1,0,0), (2,0,0) ....,(6,5,0)
    objp = np.zeros((pattern_size[0]*pattern_size[1], 3), np.float32)
    objp[:,:2] = np.mgrid[0:pattern_size[0], 0:pattern_size[1]].T.reshape(-1,2)

    # Arrays to store object points and image points from all the images.
    objpoints = []  # 3d point in real world space
    imgpoints = []  # 2d points in image plane.

    for fname in images:
        img = cv2.imread(fname)
        gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

        # Find the chess board corners
        ret, corners = cv2.findChessboardCorners(gray, pattern_size, None)

        # If found, add object points, image points (after refining them)
        if ret == True:
            objpoints.append(objp)
            corners2 = cv2.cornerSubPix(gray, corners, (11, 11), (-1, -1), criteria)
            imgpoints.append(corners2)

    # Perform camera calibration
    ret, K, dist, rvecs, tvecs = cv2.calibrateCamera(objpoints, imgpoints, gray.shape[::-1], None, None)
    return K, dist, rvecs, tvecs

# Example usage
if __name__ == "__main__":
    # Camera calibration using chessboard images
    images = ["image1.jpg", "image2.jpg", "image3.jpg"]  # Replace with actual image paths
    criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 30, 0.001)
    
    K, dist, rvecs, tvecs = calibrate_camera(images)
    print("Intrinsic matrix K:\n", K)
    print("Distortion coefficients:", dist)
    print("Rotation vectors:", rvecs)
    print("Translation vectors:", tvecs)
3.2 主要外参数
3.2.1旋转矩阵(Rotation Matrix)
  • 旋转矩阵:通常用 R 表示,是一个3x3的正交矩阵,描述了相机相对于世界坐标系的旋转角度。
3.2.2平移向量(Translation Vector)
  • 平移向量:通常用 t 表示,是一个3x1的向量,描述了相机相对于世界坐标系的平移距离。
3.3 外参数矩阵

外参数通常以一个4x4的齐次变换矩阵 T T T 表示:

T = [ R t 0 T 1 ] T = \begin{bmatrix} R & t \\ 0^T & 1 \end{bmatrix} T=[R0Tt1]

其中:

  • R R R 是旋转矩阵。
  • t 是平移向量。
  • 0 T 0^T 0T 是一个1x3的零向量。
3.3 作用
  1. 坐标变换:将三维世界坐标系中的点转换到相机坐标系中。
  2. 姿态估计:确定相机在世界坐标系中的位置和方向,常用于SLAM(同步定位与地图构建)、AR(增强现实)等应用。
相关推荐
马可露露4 小时前
自动驾驶地图数据传输协议ADASIS v2
人工智能·机器学习·自动驾驶
学步_技术6 小时前
自动驾驶系列—GLane3D: Detecting Lanes with Graph of 3D Keypoints
人工智能·机器学习·计算机视觉·3d·自动驾驶
亿佛20 小时前
(Matlab)自动驾驶仿真 设计驾驶场景、配置传感器并生成合成 数据
人工智能·算法·机器学习·自动驾驶·测试用例
慕雪华年1 天前
【SLAM】在ORB_SLAM2的ROS模式下使用RealSense D435相机
数码相机
HiEV2 天前
广汽滴滴Robotaxi首次亮相,中国自动驾驶加速领跑新赛道
自动驾驶·汽车
中达瑞和-高光谱·多光谱2 天前
高光谱相机:温室盆栽高通量植物表型光谱成像研究
数码相机
温文尔雅透你娘2 天前
摄像头在自动驾驶中的核心应用:感知算法与技术方案深度解析
人工智能·算法·计算机视觉·目标跟踪·自动驾驶
Hali_Botebie3 天前
【端到端】端到端自动驾驶依赖Occupancy进行运动规划?还是可以具有生成局部地图来规划?
人工智能·机器学习·自动驾驶
PHOSKEY3 天前
3D案例丨多个3D工业相机拼接检测 开启360°新视界
数码相机
围垦3 天前
C# visionpro联合编程中遇到的问题之 R6025 - pure virtual function call
数码相机·c#·visual studio