逆概率加权【给“稀有但重要“的观测更高的权重,给“常见但信息有限“的观测更低的权重】

逆概率加权(Inverse Probability Weighting, IPW)是一种处理数据缺失或选择偏差 的统计技术,核心思想是:给"稀有但重要"的观测更高的权重,给"常见但信息有限"的观测更低的权重,从而纠正由于某些数据被"隐藏"(如删失)导致的估计偏差。

直观类比:调查问卷

假设你想调查全校学生的平均身高:

  • 问题:女生更愿意填问卷(回复率80%),男生不愿意(回复率20%)

  • 偏差 :直接算平均值会高估(因为样本里女生太多)

  • IPW解法:给每个回复的男生权重 = 1/0.2=5 ,给每个回复的女生权重 = 1/0.8=1.25

  • 效果:男生虽然人少,但每人"代表"更多未回复者,最终平均值不再偏向女生


IPW适用于阶段数固定的删失数据是吗 重新分配权重