自动驾驶领域OCC标注

概述

OCC 标注（占据栅格标注）是自动驾驶环境感知的核心标注方案，其逻辑是将车辆周围的三维空间离散为规则的 "栅格"，并标注每个栅格的「是否被物体占据、占据类型、置信度」等信息。

OCC 标注为自动驾驶的核心感知算法（如 Occupancy Network、BEV 鸟瞰图感知）提供高密度、细粒度的环境表征数据，尤其适用于城市道路、停车场等 "物体遮挡多、场景复杂" 的场景。

详细介绍

1. 定义与价值

核心定义：将自动驾驶车辆周围的三维空间（如前向 120m、侧向 ±50m、高度 - 1~5m）按固定分辨率（如 0.2m×0.2m×0.2m）划分为 "栅格"，标注每个栅格的「占据状态、占据类型、语义类别」，形成三维 "环境占用地图"。
核心价值 ：
- 解决传统 3D 检测的 "漏检痛点"：精准捕捉不规则 / 遮挡 / 小目标的空间占据；
- 适配 BEV 感知与 Occupancy Network：支撑多模态融合、动态环境预测；
- 统一静 / 动态环境表征：简化感知 - 决策的数据交互。

2. 核心标注规范

栅格划分规则：

维度	行业标准	说明
空间范围	城市道路：前 0~120m / 高速前 0~200m；侧向 ±50m；高度 - 1~5m	覆盖核心感知区域
栅格分辨率	0.1m（高精度）/0.2m（常规）/0.5m（高速远距离）	平衡精度与标注成本
坐标系	车辆坐标系（ego-centric）/ 世界坐标系	便于算法实时处理

核心标注字段（每个栅格必填）：

字段	可选值	说明
占据状态	0（空）/1（被占）/2（未知）	区分空栅格、被占栅格、遮挡 / 远距离区域
占据类型	S（静态）/D（动态）/U（未知）	静态（道路 / 护栏）、动态（车辆 / 行人）
语义类别	细分类型（道路 / 车辆 / 行人等）	统一分类标准（如 "大型货车""施工锥"）
置信度	0~1.0	表征标注可靠性（人工标注默认 1.0）

动态场景补充标注（高阶需求）：含 "速度信息（动态物体的速度 / 方向）、时间序列一致性（跨帧栅格 ID 关联）、遮挡关系（补全被遮挡物体的占据范围）"。
语义类别分层：
- 静态环境类（S）：道路结构（道路 / 人行道）、固定障碍物（护栏 / 树木）、静态障碍物（井盖 / 施工锥）；
- 动态目标类（D）：车辆（轿车 / 货车）、行人（成人 / 推婴儿车）、骑行者（电动车 / 自行车）；
- 其他类（U）：未知物体、临时遮挡物。

3. 标注工具与流程

主流工具：

工具名	核心优势	适用场景
Apollo Occupancy Labeler	百度开源，支持点云 + 图像融合、跨帧校验	大规模数据集、BEV 算法研发
Luminar Label Studio	高分辨率点云标注、自动预标注	激光雷达数据、高精度场景
Supervisely	多模态数据标注、团队协作	跨模态融合、中小型团队
CVAT（扩展插件）	开源免费、自定义字段	低成本落地、自定义流程

标注流程（大规模生产）：
1. 数据预处理：对齐多传感器数据（点云 / 图像 / IMU）、生成栅格模板；
2. 预标注：用预训练模型自动标注占据状态 / 语义，人工修正错误；
3. 人工精标：修正语义、标注动态信息、补全遮挡区域；
4. 质检复核：自动化脚本检查一致性 + 25% 人工抽检；
5. 数据导出：输出算法可读格式（JSON/ProtoBuf），附带元数据。

4. 应用场景

感知算法：BEV 语义分割、3D 检测优化（遮挡目标）、环境补全（远距离 / 遮挡区域）；
决策规划：无碰撞路径规划、动态风险预测（提前避让）；
数据挖掘与模型迭代：筛选高价值场景（拥堵 / 施工）、定位模型漏检 / 错检原因。

落地注意事项

1. 平衡精度与效率

避免过度追求高分辨率（如 0.05m×0.05m）导致标注成本翻倍：常规道路场景优先采用 0.2m 分辨率，高精度场景（如泊车）再提升至 0.1m；
动态目标的速度、方向标注按需取舍：感知算法可简化，决策预测算法需细化。

2. 统一标注标准

制作详细标注手册：明确语义类别的判定边界（如 "电动自行车" 与 "摩托车" 的区分、"施工锥" 与 "路锥" 的统一），附大量示例图；
岗前培训与考核：标注员需通过考核（如随机抽取 10 个场景标注，准确率≥95% 方可上岗），避免个体差异导致标注不一致。

3. 适配传感器能力

标注范围不可超出传感器有效量程（如 LiDAR 有效测距 150m，不应标注 200m 处的栅格）；
相机无法覆盖的远距离区域（如夜间无路灯），栅格标注为 "2（未知）"，而非主观臆断。

4. 数据存储优化

Occupancy 标注数据量较大（如 0.2m 分辨率、120m×100m×6m 范围约 1.8 亿个栅格），建议采用稀疏存储格式（仅存储被占据和未知的栅格，空栅格不存储），降低存储成本；
导出时压缩数据（如用 GZIP 压缩 JSON 文件），便于算法读取和传输。

总结

Occupancy 标注的核心是 "三维空间的精细化占据表征"，通过栅格级标注解决了传统目标检测标注的 "漏检、遮挡" 痛点，是支撑高阶自动驾驶 BEV 感知、Occupancy Network 等算法的关键数据基础。在实际落地中，需重点关注 "标注规范统一、预标注提效、质检流程闭环"，同时结合飞书等协同工具优化团队协作效率。如果需要具体场景的标注模板（如飞书多维表格格式的语义类别清单、标注审核表），或某类工具的实操指南，可以进一步补充需求！