TMI | 噪声标签学习新思路:先判断样本可信度,再筛选体素监督

本文面向CT医学图像分割中的噪声标签学习 问题。3D医学分割依赖大量体素级精标注,但专家标注成本高;MedSAM等基础模型虽可利用点、框、涂鸦等稀疏提示降低成本,但在胃壁、胰腺/肝脏肿瘤等边界模糊、低对比区域上仍容易失效。论文在图1中展示:噪声标签比例增加会明显降低分割性能,且粗标注、形态学膨胀/腐蚀、内外包围框都会引入边界偏差。

已有噪声标签方法多依赖标签修正或标签选择。前者可能因错误修正造成误差累积,后者常只在样本级或体素级单一层面筛选,难以同时利用不同质量标签。作者的核心动机是:边界区域更容易体现噪声与不确定性,因此应先在样本级区分低质量数据可信度,再在体素级筛选可靠监督,实现从全局到局部的可靠标签传播。

我整理了文中提出的区域不确定性估计(RUE)+ 样本分层训练(SST) 的关键公式解读与伪代码实现指南,帮助你快速复现"从边界引导不确定性到样本筛选"的完整流程。感兴趣的自取,希望能帮到你!

另外,我整理了一份可直接引用的论文笔记:**边界引导不确定性估计+样本分层训练,附核心公式、对比表格与局限性分析。**感兴趣的dd,希望能帮到你!

原文 姿.料,这儿!

二、核心方法

  • 整体思路:在双解码器网络中,利用边界引导的不确定性估计对低质量样本分层训练,并在体素级筛选伪标签与噪声标签中的可靠部分。

  • 区域不确定性估计 RUE:双解码器输出类别概率,计算体素级模型不确定性:

U ( x , y , z ) ≈ 1 2 C ∑ j = 1 2 ∑ c = 1 C P c , j ( x , y , z ) 2 − 1 2 C ∑ j = 1 2 ∑ c = 1 C P c , j ( x , y , z ) 2 U^{(x,y,z)} \approx \frac{1}{2C}\sum_{j=1}^{2}\sum_{c=1}^{C}P_{c,j}\^{(x,y,z)}^2-\left\\frac{1}{2C}\\sum_{j=1}\^{2}\\sum_{c=1}\^{C}P_{c,j}\^{(x,y,z)}\\right^2 U(x,y,z)≈2C1j=1∑2c=1∑CPc,j(x,y,z)2−2C1j=1∑2c=1∑CPc,j(x,y,z)2

其中, j j j为解码器索引, c c c为类别, C C C为类别数。论文通过不同初始化、上采样方式和dropout率增强两个解码器差异。

  • 边界区域提取

M ( Y n ( x ) ) = F ( m 1 ) { max ⁡ e ∈ E S ( x + e ) } − F ( m 2 ) { min ⁡ e ∈ E S ( x + e ) } M(Y^{n(x)})=F^{(m_1)}\left\{\max_{e\in E}S(x+e)\right\}-F^{(m_2)}\left\{\min_{e\in E}S(x+e)\right\} M(Yn(x))=F(m1){e∈EmaxS(x+e)}−F(m2){e∈EminS(x+e)}

  • 样本置信度评分

Ψ = ∑ x , y , z U ( x , y , z ) ⊙ M ( Y n ( x , y , z ) ) ∑ x , y , z 1 U ( x , y , z ) ⊙ M ( Y n ( x , y , z ) ) \> 0 \Psi=\frac{\sum_{x,y,z}U^{(x,y,z)}\odot M(Y^{n(x,y,z)})}{\sum_{x,y,z}\mathbf{1}U\^{(x,y,z)}\\odot M(Y\^{n(x,y,z)})\>0} Ψ=∑x,y,z1U(x,y,z)⊙M(Yn(x,y,z))\>0∑x,y,zU(x,y,z)⊙M(Yn(x,y,z))

  • 样本分层训练 SST :按 Ψ \Psi Ψ排序,选前 k k k个高置信低质量样本做伪标签学习,其余继续用原噪声标签训练:

S o r t Ψ i ( X i n ) → X ( 1 ) , . . . , X ( k ) , X ( k + 1 ) , . . . , X ( B n ) Sort_{\Psi_i}(X_i^n)\rightarrowX\^{(1)},...,X\^{(k)},X\^{(k+1)},...,X\^{(B_n)} SortΨi(Xin)→X(1),...,X(k),X(k+1),...,X(Bn)

  • 语义一致性与多样性保证
    • 高置信样本用交叉伪监督,避免单解码器自我确认;
    • 体素不确定性熵筛掉不可靠伪标签:

H j ( x , y , z ) = − 1 C ∑ c = 1 C P c , j ( x , y , z ) log ⁡ P c , j ( x , y , z ) H_j^{(x,y,z)}=-\frac{1}{C}\sum_{c=1}^{C}P_{c,j}^{(x,y,z)}\log P_{c,j}^{(x,y,z)} Hj(x,y,z)=−C1c=1∑CPc,j(x,y,z)logPc,j(x,y,z)

  • 总损失

L t o t a l = L h s + λ ( t ) ( L p s e + L n o i ) L_{total}=L_{hs}+\lambda(t)(L_{pse}+L_{noi}) Ltotal=Lhs+λ(t)(Lpse+Lnoi)

λ ( t ) = α e − β ( 1 − t t m a x ) 2 \lambda(t)=\alpha e^{-\beta(1-\frac{t}{t_{max}})^2} λ(t)=αe−β(1−tmaxt)2

三、实验验证与效果

  • 数据集与任务:在Pancreas-NIH、GWS、MSD、LiMT四个CT数据集上验证,噪声包括人工粗标、形态学膨胀/腐蚀、内外框标注;默认使用10%高质量标签和90%低质量标签。
  • 主结果:表I显示,本文方法在DSC、Jaccard、95HD、ASD上整体优于TriNet、ADELE、MedSAM、MTCL、MixSegNet等方法。
  • 深入分析 :消融实验表明,RUE&SST带来主要性能提升,VUE和VIS进一步优化结果;区域提取优于无边界区域建模。超参数分析显示, k k k过大或过小都会影响训练, γ \gamma γ采用动态高斯ramp-up更有效。
  • 推广价值:方法可无缝集成到双解码器架构中,论文认为未来可扩展到MRI、PET等模态。

四、小编总结

这篇论文的重点不是简单"修正"噪声标签,而是先判断哪些低质量样本更可信,再在体素层面挑出更可靠的监督信号。它特别关注医学图像中最容易出错的边界区域,用区域不确定性服务样本分层训练。实验覆盖多个CT任务,结果说明该框架能在标注不完美时提升分割稳定性和精度。

相关推荐
-嘟囔着拯救世界-1 小时前
Claude Code 平替来了?DeepSeek-TUI 保姆级安装教程
人工智能·ai·ai编程·deepseek·vibecoding·deepseek-tui
IT_陈寒1 小时前
Vue的动态组件坑了我整整一天!
前端·人工智能·后端
ViiTor_AI1 小时前
原声克隆在视频出海中的作用:3个关键细节
人工智能
调试优选官1 小时前
2026上海GEO生成式引擎优化服务商选型:从工具堆叠到系统能力
人工智能·技术分享·geo·上海
浩风祭月1 小时前
如何用 AI 工具 10 倍速学习新技术栈:从零到生产级项目实战
人工智能·学习·chatgpt
hai3152475431 小时前
FiveOS V3.0 交付(微服务器操作系统版 · 物理合规修正
linux·人工智能·spring boot·后端·神经网络·机器学习
DO_Community1 小时前
Claude Code 的开源替代方案:用 OpenCode + DigitalOcean 实现模型自由
人工智能·开源·agent·claude·deepseek
拓朗工控1 小时前
工业视觉AI边缘计算解决方案
人工智能·深度学习·边缘计算·工控机·工业电脑·拓朗工控
Deepoch1 小时前
Deepoc数学大模型:以低幻觉特性护航半导体精准设计与制造
大数据·人工智能·算法·半导体·deepoc