BEV:MapTR传统方法多相机图像 (6 cameras, 1600×900) │ ▼ ┌─────────────────┐ │ Image Backbone │ (ResNet50, frozen stage1) │ + FPN Neck │ → 1级特征图 (256维) └────────┬────────┘ │ ▼ ┌──────────────────────────────────────────────┐ │ BEV Encoder (BEVFormerEncoder, 1层) │ │ │ │ BEV Qu