目前我的模型还差一个创新点,由于已经修改了backbone和AIFI,并且rt-detr的检查头不太好修改,CCFF这个模块我又不太想动它,目前就只能尝试修改损失函数
1.创新背景(为什么需要 WiseIoU)
在医学影像特别是钡餐超影 CT 图像中,存在 目标边界模糊、类间差异弱、噪声高 的特点。传统的 IoU/GIoU/CIoU 在边界回归时对异常样本敏感,容易出现:
-
梯度震荡
-
训练早期不稳定
-
对小目标与模糊目标拟合不够
因此,需要一种更 平滑、更鲁棒 的回归损失。
2.WiseIoU 的核心思想
WiseIoU(WIoU)通过引入 动态加权因子(Wise Weighting) 对不同质量的预测框赋予不同梯度,同时加入平滑项,使得:
-
高质量样本获得更高权重,促进精确框优化
-
低质量样本减少梯度扰动,提高训练稳定性
-
对模糊边界更友好,适合 CT 影像
其基本损失形式可写为:

其中权重项:

特点:小 IoU 区域的梯度更平滑,大 IoU 区域更精细优化。
因为我的 CT 数据边界模糊,所以 WiseIoU 可以缓解不稳定回归带来的误差。
3.WiseIoU 在本研究中的整合方式
在 rt-detr 框架中,我将原有的 CIoU 换成 WiseIoU,并依据医学小样本的特点调整了权重策略,使得模型在训练早期更加稳定。同时,我将 WiseIoU 与本文提出的 VEFN 与 PConv_Rep 模块组合,形成端到端优化结构。
实验如下:
| 模型 | Precision | Recall | F1 | mAP50 | Params(M) | GFLOPS |
|---|---|---|---|---|---|---|
| Baseline (rt-detr) | 84.4% | 70.7% | 76.9% | 80.3% | 19.8 | 57.3 |
| Baseline + WiseIoU | 85.6% | 79.3% | 82.3% | 86.1% | 19.5 | 56.6 |
效果提升:
-
Recall 提升 +8.6%
-
F1 提升 +5.4%
-
mAP50 提升 +5.8%
说明 WiseIoU 对模糊边界、小目标非常友好。