Monocular 3D Object Detection

Keep--Silent2024-07-24 11:06

要计算 trans_cam_to_img 矩阵，我们需要确定几个参数：焦距（ f x f_x fx 和 f y f_y fy），主点位置（ c x c_x cx 和 c y c_y cy），以及一些其他信息。

假设以下信息：

焦距：35mm
图像分辨率：960x540
图像DPI：96
图像位深度：24（这对于计算矩阵没有影响）

1. 计算焦距 f x f_x fx 和 f y f_y fy

DPI（Dots Per Inch）表示每英寸有多少像素。我们需要将焦距从毫米转换为像素。首先将焦距从毫米转换为英寸：

焦距 (英寸) = 35 mm 25.4 mm/inch = 1.37795276 英寸 \text{焦距 (英寸)} = \frac{35 \text{mm}}{25.4 \text{mm/inch}} = 1.37795276 \text{英寸} 焦距 (英寸)=25.4mm/inch35mm=1.37795276英寸

然后将焦距从英寸转换为像素：

f x = f y = 1.37795276 英寸 × 96 DPI = 132.27699136 像素 f_x = f_y = 1.37795276 \text{英寸} \times 96 \text{DPI} = 132.27699136 \text{像素} fx=fy=1.37795276英寸×96DPI=132.27699136像素

2. 计算主点位置 c x c_x cx 和 c y c_y cy

假设主点在图像的中心，主点位置为：

c x = 图像宽度 2 = 960 2 = 480 像素 c_x = \frac{\text{图像宽度}}{2} = \frac{960}{2} = 480 \text{像素} cx=2图像宽度=2960=480像素
c y = 图像高度 2 = 540 2 = 270 像素 c_y = \frac{\text{图像高度}}{2} = \frac{540}{2} = 270 \text{像素} cy=2图像高度=2540=270像素

3. 构建 `trans_cam_to_img` 矩阵

我们现在有了所有需要的参数：

f x = 132.27699136 像素 f y = 132.27699136 像素 c x = 480 像素 c y = 270 像素 f_x = 132.27699136 \text{像素} f_y = 132.27699136 \text{像素} c_x = 480 \text{像素} c_y = 270 \text{像素} fx=132.27699136像素fy=132.27699136像素cx=480像素cy=270像素

构建 trans_cam_to_img 矩阵：

trans_cam_to_img = [ 132.27699136 0 480 0 0 132.27699136 270 0 0 0 1 0 ] \text{trans\_cam\_to\_img} = \begin{bmatrix} 132.27699136 & 0 & 480 & 0 \\ 0 & 132.27699136 & 270 & 0 \\ 0 & 0 & 1 & 0 \end{bmatrix} trans_cam_to_img= 132.27699136000132.2769913604802701000

Monocular 3D Object Detection

1. 计算焦距 f x f_x fx 和 f y f_y fy

2. 计算主点位置 c x c_x cx 和 c y c_y cy

3. 构建 trans_cam_to_img 矩阵

3. 构建 `trans_cam_to_img` 矩阵