【南开大学-范登平组-arXiv25】Context-measure：用于伪装目标检测的情境化度量指标

文章：Context-measure: Contextualizing Metric for Camouflage

单位：南开大学

传统的图像分割评价指标（如IoU、Fβ、Sα等），最初是为"显著目标分割"设计的。它们的核心逻辑是直接对比AI预测的区域和人工标注的"标准答案"，却忽略了一个关键事实：伪装目标的本质是"依赖上下文"的。

就像文档里的经典例子：两只形态完全相同的蝴蝶，红蝴蝶停在红枫叶上（完美伪装），蓝蝴蝶停在黄枫叶上（格外显眼）。但传统指标会因为两者的预测区域与标注区域重叠度相似，给出相近的分数，完全无视了"伪装"这一核心特性。这些老指标还有两个致命缺陷：

在农业病虫害检测、医学早期病变诊断等关键场景中，这种"一刀切"的评价方式，严重阻碍了相关AI模型的迭代优化。

针对传统指标的短板，南开大学和重庆长安望江工业集团的团队提出了全球首个专为伪装目标分割设计的评价范式------Context-measure，核心创新点堪称"对症下药"：

传统指标要么假设所有像素独立，要么只考虑局部有限关联，而Context-measure建立了概率性像素关联模型 。它会计算任意两个像素之间的相关性，距离越近、语义越相似的像素，关联性越强，就像人类看物体时会关注整体结构而非孤立像素。

人类评价分割结果时，会反复对比"AI预测"和"真实情况"：既会从预测中推测真实目标，也会用真实目标验证预测是否准确。Context-measure正是模拟了这一过程：

同一个目标的不同部位，伪装程度可能不同（比如蝴蝶翅膀边缘比中心更贴近树叶颜色）。Context-measure通过两步法精准量化每个像素的伪装度：

最后，将伪装度作为权重融入评分，让"越难识别的伪装区域，分对了越加分"，彻底解决了传统指标"一视同仁"的弊端。

为了证明Context-measure的有效性，团队做了全方位的实验验证，结果堪称"降维打击"：

人类一致性：团队构建了首个"人类标注伪装分割排名数据集CamoHR"，Context-measure与人类判断的一致性比传统指标提升41%，其中伪装专属版本Cβ^ω的表现最优；
语义敏感性：当故意用错误的"标准答案"匹配预测结果时，Context-measure能100%识别这种语义 mismatch，错误率接近0，而传统指标Eϕ的错误率高达3.46%；
抗噪性：给预测结果添加轻微高斯噪声后，Context-measure能精准捕捉这种细微质量下降，错误率远低于传统指标；
边界稳定性：对"标准答案"的边界进行轻微调整（膨胀/腐蚀），Context-measure的评分波动最小，稳定性领先所有对比指标。

Context-measure通过像素关联建模、双向感知循环和像素级伪装度量化，打造了伪装目标分割的专属评价基准，解决了传统指标忽视上下文的核心痛点，为农业、医学、工业等领域的伪装目标识别技术迭代提供了关键支撑！