为何高阶自动驾驶偏爱 Raw Sensor？

在智能驾驶的感知系统中，摄像头是车辆的"眼睛"。但你是否注意到：特斯拉、Waymo、小鹏 XNGP、蔚来 NAD 等高阶方案，几乎无一例外地选择输出原始 RAW 数据的摄像头，而非自带 ISP 处理的"智能摄像头"？

这并非偶然。背后是一场关于信息完整性、算法自由度与系统架构演进的抉择。

本文将从传输链路、带宽需求、感知性能三个维度，解析为何 L3+ 自动驾驶坚定拥抱 Raw Sensor（无 ISP 摄像头）。

首先明确概念：

📌 关键差异 ：
Raw Sensor 传递的是"光子信息"，Smart Camera 传递的是"人眼友好图像" ------ 而自动驾驶算法，需要的是前者。

单根同轴<6--12 Gbps>
图像传感器(RAW12, MIPI CSI-2)
GMSL 串化器
GMSL 解串器
SoC

(FSD / Orin / J5)
片上 ISP
AI 感知模型

YUV422 / H.264
图像传感器
板载 ISP
GMSL 或100BASE-T1
域控制器
应用算法

用真实数据说话：

视频格式	分辨率 & 帧率	比特深度	计算方式	带宽需求
RAW12（Bayer）	8MP @ 30fps	12 bit	`3840×2160 × 30 × 12 ÷ 2`	≈ 1.5 Gbps
RAW12（8MP 全分辨率）	3840×2160 @ 30fps	12 bit	`3840×2160 × 30 × 12`	≈ 3.0 Gbps
YUV422	1080p @ 30fps	16 bit/pixel	`1920×1080 × 30 × 16`	≈ 1.0 Gbps
RGB888	1080p @ 30fps	24 bit/pixel	`1920×1080 × 30 × 24`	≈ 1.5 Gbps
H.264（压缩）	1080p @ 30fps	~4 Mbps	编码压缩	≈ 0.004 Gbps

💡 注：RAW 数据因 Bayer 阵列只需单通道采样，实际带宽约为全彩的 1/2。

厂商	平台	摄像头型号	是否带 ISP	传输方案
Tesla	HW 3.0 / HW 4.0	Sony IMX4xx / IMX6xx	❌ 否	GMSL2/3
NVIDIA	DRIVE Thor	ON Semiconductor AR0820AT	❌ 否	GMSL3
小鹏	XNGP	OmniVision OV8856	❌ 否	GMSL2
蔚来	NAD	Sony STARVIS 2	❌ 否	GMSL3
Mobileye	EyeQ6	ACU Reference Design	❌ 否	FPD-Link III

✅ 共识：L3+ 系统 = Raw Sensor + 中央 ISP + 高速 SerDes。

当然有------但在特定场景：

但一旦进入 城市 NOA、Robotaxi、端到端大模型 时代，Raw Sensor 就是唯一选择。

高阶自动驾驶的本质，是让机器"看见世界本来的样子"，而非"人类认为它该有的样子"。

Raw Sensor 放弃了即插即用的便利，换来了算法演进的无限可能 。

它要求更强的芯片、更复杂的链路、更高的工程投入------但这正是通往 L4 的必经之路。

正如 Tesla AI 负责人 Andrej Karpathy 所言：
"我们不是在构建一个摄像头系统，而是在构建一个视觉皮层。"

而皮层的第一步，就是接收未经过滤的原始信号。

附：本文所有图表均采用 Mermaid 语法编写，可直接用于支持 Mermaid 的 Markdown 编辑器（如 Typora、Obsidian、GitHub）。带宽计算基于标准视频公式，实际值因 blanking interval 略有浮动。