YOLOv2 正负样本分配机制详解

在目标检测任务中，正负样本的定义 决定了哪些预测框用于训练，以及如何计算损失函数。YOLOv2 在 YOLOv1 的基础上，引入了 Anchor Boxes（锚框） 机制，正负样本的判断方式也发生了重要变化。

YOLOv2 将图像划分为 S × S S \times S S×S 网格，每个网格预测 B B B 个 Anchor Box（默认 5 个），每个 Anchor 预测：

满足以下条件的预测框被视为正样本：

即：一张图中有多个目标，每个目标仅分配给一个最合适的 Anchor。

这些 Anchor 被作为负样本，仅用于训练置信度（objectness）为 0。

python 复制代码

Grid Cell (7x7)
  └─ 每个 Cell 预测 5 个 Anchor Box
        ├─ 与某个 GT IOU 最大 → 正样本
        ├─ IOU 太低 → 负样本
        └─ 其他 Anchor 忽略

YOLOv2 中的正负样本策略，主要围绕 Anchor Box 与 Ground Truth 的匹配关系：

• 正样本：与 GT 匹配 IOU 最大的 Anchor

• 负样本：其余 Anchor 且 IOU 低

• 忽略：其他 IOU 不高不低者（可选处理）

Bounding Box 与 Anchor 的关系详解

在目标检测中，Anchor Box 是模型预设的一组参考框模板 ，而 Bounding Box 是模型预测的最终目标框，两者之间的关系如下：

名称	说明
Anchor Box	预定义的固定尺寸框，用于覆盖不同尺寸、宽高比的目标
Bounding Box	模型输出的框，用于拟合真实物体（Ground Truth Box）的位置

模型以 Anchor 为起点，通过预测 偏移量（offset） 对其进行微调；
每个 Anchor 会输出一个预测框（Bounding Box）；
训练过程中，选出与 Ground Truth 重合度最高（IoU 最大）的 Anchor，作为正样本；
最终的 Bounding Box 是：
B pred = Anchor + 偏移量 B_{\text{pred}} = \text{Anchor} + \text{偏移量} Bpred=Anchor+偏移量

Anchor 是起点，Bounding Box 是终点。