本文系《可信实验白皮书》系列的第五篇文章,上一篇我们围绕随机轮转实验展开,内容主要包括抛硬币随机轮转、完全随机轮转、配对随机轮转等几个实验方法的介绍。本篇我们会介绍准实验,然后会重点介绍双重差分法,包括概述、评估原理及美团的一些实践案例。
本文系《可信实验白皮书》系列的第五篇文章,上一篇我们围绕随机轮转实验展开,内容主要包括抛硬币随机轮转、完全随机轮转、配对随机轮转等几个实验方法的介绍。本篇我们会介绍准实验,然后会重点介绍双重差分法,包括概述、评估原理及美团的一些实践案例。
准实验(Quasi-experiment)适用于"实验设计者"可干预分组,但无法随机分配实验单元至实验组和对照组的场景。经典随机对照实验通过随机分配实验单元,保证了实验组和对照组的可观测特征和不可观测特征分布都是相同的,差异仅在于样本是否受策略影响,因此两组观测结果的差异可以归因于策略影响。然而,在一些无法随机分配样本的场景下,实验组和对照组的特征分布往往不一致,进而导致两个组在未施加策略时就存在差异,此时需在满足部分特定条件假设的前提下使用准实验评估方法,才能够比较准确地估计策略的效果。
以美团履约业务场景为例,以下几个因素可能阻碍进行时空粒度的随机实验。
溢出效应+小样本等多重约束下无法开展时空随机实验:
- 溢出效应:履约业务是一个典型的多边场景,容易造成实验单元间相互依赖和影响,而简单的随机对照实验,通常会违背个体处理稳定性假设(SUTVA),进而造成实验偏差。在这种存在溢出效应的履约业务场景中,实验有时需要在地理上隔离样本,以避免或者减少溢出效应,一种典型的做法是依据地理位置将一个城市划分为两个半城,将实验组和对照组之间的运力溢出等限制在半城交界处,将溢出效应的影响尽量降至最低。
- 小样本:履约策略大多以配送区域为基本单元,即使是区域溢入溢出效应模型也通常要求配送区域数量至少超过20个。但是部分城市规模较小,可供分析建模的配送区域数量达不到该要求,因此也无法采用随机分组+溢出效应建模的实验方案。
策略和产品的特殊性:部分策略和产品的特殊性限制了随机分组。例如,配送区域优化策略考虑在保障整体覆盖范围不变且区域之间不重叠的约束下,对区域进行边界优化甚至合并,然而对于2个相邻的区域,在该约束下,优化A区域边界必然会导致B边界跟随变化,因此从产品形态上无法实现A区域边界变更但B区域边界维持不变,此时不能考虑按区域随机分流。
综上所述,考虑到美团履约业务场景的特殊性,许多实验无法采用随机对照实验准确量化策略效果,因此发展一套标准的准实验设计与评估流程尤为必要。接下来,我们着重介绍经典的准实验方法------双重差分法,关于双重差分法的衍生和其他准实验方法,请参考文末的拓展部分。
5.1 双重差分法
5.1.1 方法概述
双重差分法 (Difference in differences,简称DID)的基本思想,就是用实验后的实验组、对照组差异减去实验前的实验组、对照组差异,来估计策略在实验组上的效果(ATT),图5-1直观展示了该思想。下面先从单重差分开始,逐步解析双重差分法。

在无法实施随机对照实验的情况下,我们可以通过收集实验组群体、对照组群体在实验前后时间段的面板数据,来分析策略效果。不失一般性,假设实验前实验组个体平均值记为 <math xmlns="http://www.w3.org/1998/Math/MathML"> T b e f o r e T_{before} </math>Tbefore,实验前对照组个体平均值记为 <math xmlns="http://www.w3.org/1998/Math/MathML"> C b e f o r e C_{before} </math>Cbefore,实验后实验组个体平均值记为 <math xmlns="http://www.w3.org/1998/Math/MathML"> T a f t e r T_{after} </math>Tafter,实验后对照组个体平均值记为 <math xmlns="http://www.w3.org/1998/Math/MathML"> C a f t e r C_{after} </math>Cafter。我们先看2种Naive的评估方法。
- 实验组-对照组(横截面单重差分法) :即用实验后实验组的观测值 <math xmlns="http://www.w3.org/1998/Math/MathML"> T a f t e r T_{after} </math>Tafter减去实验后对照组的观测值 <math xmlns="http://www.w3.org/1998/Math/MathML"> C a f t e r C_{after} </math>Cafter得到 <math xmlns="http://www.w3.org/1998/Math/MathML"> T a f t e r − C a f t e r T_{after}-C_{after} </math>Tafter−Cafter,来估计策略效果。但是在无法随机分配实验组和对照组的情况下,两组之间往往存在固有差异,因此简单地使用实验组减对照组的估计结果可能会存在偏差。
- 实验后-实验前(时间序列单重差分法) :即用实验后实验组的观测值 <math xmlns="http://www.w3.org/1998/Math/MathML"> T a f t e r T_{after} </math>Tafter减去实验前实验组的观测值 <math xmlns="http://www.w3.org/1998/Math/MathML"> T b e f o r e T_{before} </math>Tbefore得到 <math xmlns="http://www.w3.org/1998/Math/MathML"> T a f t e r − T b e f o r e T_{after}-T_{before} </math>Tafter−Tbefore,来估计策略效果。但是随着时间推移外部条件发生变化,即使不施加策略,实验组指标也可能会随时间自然变化,因此使用实验后减实验前的估计结果往往也存在偏差。
双重差分法在上述两种单重差分法基础上进行了改进:其基本思想为假设实验组和对照组在不施加策略时差异固定不变,用实验组对照组在实验后的差异减去实验组对照组在实验前的差异,得到:
<math xmlns="http://www.w3.org/1998/Math/MathML"> ( T a f t e r − C a f t e r ) − ( T b e f o r e − C b e f o r e ) (T_{after}-C_{after}) - (T_{before}-C_{before}) </math>(Tafter−Cafter)−(Tbefore−Cbefore)
消除了两组之间的固有差异,这就是双重差分法的基本原理。

5.1.2 评估原理
本节我们将详细介绍双重差分法的数学模型和原理,包括传统DID模型、固定效应模型、平行趋势假设合理性检验等。
传统DID模型
基本双重差分法模型的形式为:
<math xmlns="http://www.w3.org/1998/Math/MathML"> Y i t = β 0 + β 1 × t r e a t i + β 2 × a f t e r t + β 3 × t r e a t i × a f t e r t + e i t Y_{it} = \beta_0 + \beta_1 \times treat_i + \beta_2 \times after_t + \beta_3 \times treat_i \times after_t + e_{it} </math>Yit=β0+β1×treati+β2×aftert+β3×treati×aftert+eit
其中, <math xmlns="http://www.w3.org/1998/Math/MathML"> i i </math>i表示个体, <math xmlns="http://www.w3.org/1998/Math/MathML"> t t </math>t表示时间; <math xmlns="http://www.w3.org/1998/Math/MathML"> Y i t Y_{it} </math>Yit是个体 <math xmlns="http://www.w3.org/1998/Math/MathML"> i i </math>i在时间 <math xmlns="http://www.w3.org/1998/Math/MathML"> t t </math>t的指标值; <math xmlns="http://www.w3.org/1998/Math/MathML"> t r e a t i treat_i </math>treati是分组虚拟变量,如果个体 <math xmlns="http://www.w3.org/1998/Math/MathML"> i i </math>i属于实验组,则 <math xmlns="http://www.w3.org/1998/Math/MathML"> t r e a t i = 1 treat_i=1 </math>treati=1,否则 <math xmlns="http://www.w3.org/1998/Math/MathML"> t r e a t i = 0 treat_i=0 </math>treati=0; <math xmlns="http://www.w3.org/1998/Math/MathML"> a f t e r t after_t </math>aftert是分期虚拟变量,如果时间 <math xmlns="http://www.w3.org/1998/Math/MathML"> t t </math>t在实验后,则 <math xmlns="http://www.w3.org/1998/Math/MathML"> a f t e r t = 1 after_t=1 </math>aftert=1,否则 <math xmlns="http://www.w3.org/1998/Math/MathML"> a f t e r t = 0 after_t=0 </math>aftert=0; <math xmlns="http://www.w3.org/1998/Math/MathML"> e i t e_{it} </math>eit是期望为0的干扰项; <math xmlns="http://www.w3.org/1998/Math/MathML"> β j \beta_j </math>βj是待估计的模型系数。
在该模型下,实验组对照组在实验前后的均值以及差分可以写成下表中展示的形式,并以此解读各项系数: <math xmlns="http://www.w3.org/1998/Math/MathML"> β 0 \beta_0 </math>β0表示实验前对照组的均值; <math xmlns="http://www.w3.org/1998/Math/MathML"> β 1 \beta_1 </math>β1表示实验前实验组均值和对照组均值的差异; <math xmlns="http://www.w3.org/1998/Math/MathML"> β 2 \beta_2 </math>β2表示对照组在实验前后均值的差异; <math xmlns="http://www.w3.org/1998/Math/MathML"> β 3 \beta_3 </math>β3 表示策略的效果。

使用传统DID模型对实验前后面板数据进行回归计算,可以得到策略效果的估计量 <math xmlns="http://www.w3.org/1998/Math/MathML"> β ^ 3 \hat\beta_3 </math>β^3、估计量方差、 <math xmlns="http://www.w3.org/1998/Math/MathML"> p p </math>p值、置信区间、MDE等一系列统计量。此处需要强调一点,上述对于 <math xmlns="http://www.w3.org/1998/Math/MathML"> β 3 \beta_3 </math>β3的估计其实是对于指标绝对提升的估计,但在实际场景的应用中还会希望计算某些指标的相对提升,此时需要额外计算实验组的反事实:
<math xmlns="http://www.w3.org/1998/Math/MathML"> T c o u n t e r f a c t = T b e f o r e + ( C a f t e r − C b e f o r e ) = C a f t e r + ( T b e f o r e − C b e f o r e ) T_{counterfact} = T_{before} + (C_{after} - C_{before}) = C_{after} + (T_{before} - C_{before}) </math>Tcounterfact=Tbefore+(Cafter−Cbefore)=Cafter+(Tbefore−Cbefore)
表示实验组在实验后假如未施加策略时的均值,并进一步计算相对提升。
固定效应模型
为了进一步提高模型的精度,可以引入时间和个体固定效应,对不同时间和不同个体的效应做进一步细化,可以得到时间固定效应模型和时间 + 个体固定效应模型。固定效应模型可以消除时间和个体上的差异,估计系数的方差也会降低,对于策略效应的检测也更加灵敏,在实践中会优先使用固定效应模型。引入了时间固定效应 <math xmlns="http://www.w3.org/1998/Math/MathML"> ϕ t \phi_t </math>ϕt的时间固定效应模型形式如下:
<math xmlns="http://www.w3.org/1998/Math/MathML"> Y i t = α + β × t r e a t i × a f t e r t + α 1 × t r e a t i + ϕ t + e i t Y_{it} = \alpha + \beta \times treat_i \times after_t + \alpha_1 \times treat_i + \phi_t + e_{it} </math>Yit=α+β×treati×aftert+α1×treati+ϕt+eit
在对系数进行估计时,进一步引入时间虚拟变量 <math xmlns="http://www.w3.org/1998/Math/MathML"> T t T_t </math>Tt,将模型写为以下形式,再使用最小二乘法进行计算,此即最小二乘虚拟变量估计法:
<math xmlns="http://www.w3.org/1998/Math/MathML"> Y i t = α + β × t r e a t i × a f t e r t + α 1 × t r e a t i + ∑ t = 1 T − 1 γ t × T t + e i t Y_{it} = \alpha + \beta \times treat_i \times after_t + \alpha_1 \times treat_i + \sum_{t=1}^{T-1} \gamma_t \times T_t + e_{it} </math>Yit=α+β×treati×aftert+α1×treati+∑t=1T−1γt×Tt+eit
引入了时间固定效应 <math xmlns="http://www.w3.org/1998/Math/MathML"> ϕ t \phi_t </math>ϕt和个体固定效应 <math xmlns="http://www.w3.org/1998/Math/MathML"> λ i \lambda_i </math>λi的时间 + 个体固定效应模型形式如下:
<math xmlns="http://www.w3.org/1998/Math/MathML"> Y i t = α + β × t r e a t i × a f t e r t + λ i + ϕ t + e i t Y_{it} = \alpha + \beta \times treat_i \times after_t + \lambda_i + \phi_t + e_{it} </math>Yit=α+β×treati×aftert+λi+ϕt+eit
在对系数进行估计时,仍可使用最小二乘虚拟变量估计法,进一步引入时间虚拟变量 <math xmlns="http://www.w3.org/1998/Math/MathML"> T t T_t </math>Tt和个体虚拟变量 <math xmlns="http://www.w3.org/1998/Math/MathML"> D i D_i </math>Di,将模型写为以下形式再计算:
<math xmlns="http://www.w3.org/1998/Math/MathML"> Y i t = α + β × t r e a t i × a f t e r t + ∑ i = 1 N − 1 δ i × D i + ∑ t = 1 T − 1 γ t × T t + e i t Y_{it} = \alpha + \beta \times treat_i \times after_t + \sum_{i=1}^{N-1} \delta_i \times D_i + \sum_{t=1}^{T-1} \gamma_t \times T_t + e_{it} </math>Yit=α+β×treati×aftert+∑i=1N−1δi×Di+∑t=1T−1γt×Tt+eit
在个体数目较多时,虚拟变量过多可能会导致计算性能的问题,此时可以使用个体内差分估计法:
① 首先将模型写作以下形式,其中 <math xmlns="http://www.w3.org/1998/Math/MathML"> X i t X_{it} </math>Xit由交叉项 <math xmlns="http://www.w3.org/1998/Math/MathML"> t r e a t i × a f t e r t treat_i \times after_t </math>treati×aftert和时间虚拟变量 <math xmlns="http://www.w3.org/1998/Math/MathML"> T t T_t </math>Tt组成:
<math xmlns="http://www.w3.org/1998/Math/MathML"> Y i t = α + X i t T β + λ i + e i t Y_{it} = \alpha + \mathbf{X}{it}^T \boldsymbol{\beta} + \lambda_i + e{it} </math>Yit=α+XitTβ+λi+eit
② 对每个个体的变量取平均值,得到:
<math xmlns="http://www.w3.org/1998/Math/MathML"> Y ‾ i = α + X ‾ i T β + λ i + e ‾ i \overline{Y}{i} = \alpha + \overline{\mathbf{X}}{i}^T \boldsymbol{\beta} + \lambda_i + \overline{e}_{i} </math>Yi=α+XiTβ+λi+ei
③ 相减得到下式,其中 <math xmlns="http://www.w3.org/1998/Math/MathML"> Y ~ i t = Y i t − Y ‾ i \widetilde{Y}{it} = Y{it} - \overline{Y}{i} </math>Y it=Yit−Yi, <math xmlns="http://www.w3.org/1998/Math/MathML"> X ~ i t = X i t − X ‾ i \widetilde{\mathbf{X}}{it} = \mathbf{X}{it} - \overline{\mathbf{X}}{i} </math>X it=Xit−Xi, <math xmlns="http://www.w3.org/1998/Math/MathML"> e ~ i t = e i t − e ‾ i \widetilde{e}{it} = e{it} - \overline{e}_{i} </math>e it=eit−ei:
<math xmlns="http://www.w3.org/1998/Math/MathML"> Y ~ i t = X ~ i t T β + e ~ i t \widetilde{Y}{it} = \widetilde{\mathbf{X}}{it}^T \boldsymbol{\beta} + \widetilde{e}_{it} </math>Y it=X itTβ+e it
④ 再使用最小二乘法计算该模型,得到对系数 <math xmlns="http://www.w3.org/1998/Math/MathML"> β \boldsymbol{\beta} </math>β的估计,可以证明使用个体内差分估计法和最小二乘虚拟变量估计法得到的结果一致。
平行趋势假设合理性检验
平行趋势假设是使用双重差分法估计策略效果的关键假设。平行趋势假设要求,在没有策略影响的情况下,实验组和对照组的差异不随时间变化是恒定的,即实验组和对照组的趋势保持平行。一种简单的平行趋势检验方法是通过画图观察平行趋势是否满足,但是这种方法比较粗糙。为了得到更加严谨的量化结果,可以使用模型进行平行趋势检验。在此基础上一种方法是将DID模型拓展为以下形式:
<math xmlns="http://www.w3.org/1998/Math/MathML"> Y i t = β 0 + β 1 1 × t r e a t i + β 1 2 × t r e a t i × t i m e 2 + ⋯ + β 1 T 0 × t r e a t i × t i m e T 0 + β 2 × a f t e r t + β 3 × t r e a t i × a f t e r t + e i t Y_{it} = \beta_0 + \beta_1^1 \times treat_i + \beta_1^2 \times treat_i \times time_2 + \dots + \beta_1^{T_0} \times treat_i \times time_{T_0}+ \beta_2 \times after_t + \beta_3 \times treat_i \times after_t + e_{it} </math>Yit=β0+β11×treati+β12×treati×time2+⋯+β1T0×treati×timeT0+β2×aftert+β3×treati×aftert+eit
其中 <math xmlns="http://www.w3.org/1998/Math/MathML"> t i m e t time_t </math>timet是时间虚拟变量, <math xmlns="http://www.w3.org/1998/Math/MathML"> t ≤ T 0 t \leq T_0 </math>t≤T0为实验前没有施加策略的时期。如果平行趋势成立,那么在没有施加策略的每个时间点,实验组和对照组的差异没有显著变化,即有 <math xmlns="http://www.w3.org/1998/Math/MathML"> β 1 2 = ⋯ = β 1 T 0 = 0 \beta_1^2 = \dots = \beta_1^{T_0} = 0 </math>β12=⋯=β1T0=0。因此,只需检验 <math xmlns="http://www.w3.org/1998/Math/MathML"> β 1 2 = ⋯ = β 1 T 0 = 0 \beta_1^2 = \dots = \beta_1^{T_0} = 0 </math>β12=⋯=β1T0=0是否成立。若系数均不显著( <math xmlns="http://www.w3.org/1998/Math/MathML"> p p </math>p值大于0.05),则认为通过平行趋势检验。
另一种常用方法是,指定一个实验前时间为虚构的策略开始施加的时间,然后使用DID模型对实验前数据进行回归分析,若系数不显著( <math xmlns="http://www.w3.org/1998/Math/MathML"> p p </math>p值大于0.05),则认为通过平行趋势检验。这种方法又称作安慰剂检验,虽然严格性不如第一种方法,但是胜在简单好用,该检验方法和实验评估方法一致,在实践中更加常用。
5.1.3 平行趋势分组
不难看出,平行趋势假设是影响双重差分实验结论可信度的关键。因此,为了尽量保证实验结论的可信度,我们建议采取下述平行趋势分组,以尽量保障"实验组"、"对照组"平行趋势假设的合理性:
- 随机划分2个半城为实验组和对照组;
- 使用实验前数据,对所有目标指标和护栏指标做平行趋势检验,根据通过检验的模型和实验组对照组差异对本次分组进行打分(通过固定效应模型平行趋势检验的分组得分更高,两组差异更小的分组得分更高);
- 重复步骤1和步骤2若干次,选取得分最高的分组作为最终分组。
尽管采取平行趋势分组的做法在实验设计上尽量保障平行趋势假设的合理性,但在实际场景中仍存在以下潜在风险,因此在实践中优先考虑随机实验,随机实验不可行时才考虑双重差分实验:
- 平行趋势是一个比较强的假设,在样本量较少时,有时难以划分满足平行趋势的实验组和对照组;
- 平行趋势检验只能检验实验前的平行趋势以证明假设的合理性,实验后的平行趋势是否满足是无法得知的,并且无法得到完全保证,在某些情况下平行趋势假设会受到挑战:
a. 有不可控的外部因素影响时,平行趋势假设可能被打破,此时可考虑适当剔除不可控因素影响日期再进行评估分析;
b. 评估指标的数值限定范围,可能影响到平行趋势。在履约场景中准时率指标时常被关注,准时率的数值范围在0~100%之间并且通常处于较高水位,在某些极端情况下如果平行趋势成立,实验组准时率的反事实结果可能会超过其上限100%,这时平行趋势假设与实际情况会略有出入。
5.1.4 实验案例
实验案例:配送区域优化实验
实验背景:为解决现有配送区域划分畸形、切割商户热力等问题,提升配送效率,通过算法智能规划对各城市配送区域进行重新规划。
实验目标:降低运单超出配送区域范围占比,提高配送效率。
实验指标:
- 目标指标:xxxx;
- 护栏指标:xxxx。
实验难点及约束:
- 策略和产品的特殊性:配送区域优化策略考虑在保障整体覆盖范围不变且区域之间不重叠的约束下,对加盟区域进行边界优化甚至合并,然而对于2个相邻的区域,在该约束下,优化A区域边界必然会导致B边界跟随变化,因此从产品形态上无法实现A区域边界变更但B区域边界维持不变,此时不能考虑按区域随机分流。这种情况下可以考虑将城市划分为两个半城,在实验半城内部调整优化区域边界,对照半城维持不变。
实验方案:考虑到实验难点及约束,采用半城平行趋势分组,并使用双重差分法进行评估。
实验设计:采用半城划分+平行趋势检验的实验设计机制,对城市中配送区域进行分组,详细流程可见图5-2:

实验评估:根据实验前通过哪个模型的平行趋势检验来决定用哪个模型来评估实验后策略效果,详细流程可见图5-3,评估结果以下表为例:


5.2 拓展与展望
5.2.1 双重差分法拓展
在传统DID模型设定中,一个隐含假设是,实验组的所有个体开始实验的时间均相同。但有时我们也会遇到每个个体的实验时间不完全一致的情形(Staggered Timing),比如有的实验经过逐步放量,一部分个体从实验第1天就开始接受策略处理,而另一部分个体则等到放量之后,第8天才开始接受策略。这时我们就可以用多时点DID模型来同时考察多次实验的效果,模型设定如下:
<math xmlns="http://www.w3.org/1998/Math/MathML"> Y i t = α + λ i + ϕ t + β × e f f e c t i t + e i t Y_{it}=\alpha+\lambda_i +\phi_t +\beta \times effect_{it}+e_{it} </math>Yit=α+λi+ϕt+β×effectit+eit
其中对于某个个体的 <math xmlns="http://www.w3.org/1998/Math/MathML"> e f f e c t i t effect_{it} </math>effectit,如果个体 <math xmlns="http://www.w3.org/1998/Math/MathML"> i i </math>i是从 <math xmlns="http://www.w3.org/1998/Math/MathML"> t 0 t_0 </math>t0时开始接受实验,那么 <math xmlns="http://www.w3.org/1998/Math/MathML"> t 0 t_0 </math>t0之前时间点 <math xmlns="http://www.w3.org/1998/Math/MathML"> e f f e c t i t effect_{it} </math>effectit取0, <math xmlns="http://www.w3.org/1998/Math/MathML"> t 0 t_0 </math>t0及之后时间点 <math xmlns="http://www.w3.org/1998/Math/MathML"> e f f e c t i t effect_{it} </math>effectit取1,对于从来没有接受策略的对照组, <math xmlns="http://www.w3.org/1998/Math/MathML"> e f f e c t i t effect_{it} </math>effectit始终取0。同样5.1节介绍的处理效应模型一般假设"同质性处理效应",即所有个体的处理效应都相同。对此,异质性双重差分模型在传统DID基础上引入"异质性处理效应",即允许每位个体(或群体)的处理效应不尽相同。具体而言是对双重差分模型中交互项(treat*post)的调整,即引入在组别上的交互项(treat*post*group)。
此外,在固定效应模型中可进一步考虑加入其他可观测的随时间变化的协变量 <math xmlns="http://www.w3.org/1998/Math/MathML"> X i t X_{it} </math>Xit,但前提为协变量不可受实验策略影响。引入新的协变量通常存在两个重要作用,一方面通常可以更进一步的降低估计值的方差;另一方面在实验前后环境存在较大变化时,添加相应的观测协变量有助于控制因协变量差异导致的估计误差,缓解因环境变更对平行趋势假设带来的不合理风险。例如拓展后的模型形式如下:
<math xmlns="http://www.w3.org/1998/Math/MathML"> Y i t = α + β × t r e a t i × a f t e r t + γ × X i t + λ i + ϕ t + e i t Y_{it} = \alpha + \beta \times treat_i \times after_t + \gamma \times X_{it} + \lambda_i + \phi_t + e_{it} </math>Yit=α+β×treati×aftert+γ×Xit+λi+ϕt+eit
在实践中当出现平行趋势不成立的情况时(建议尽量在实验设计上采取更合理的分组,如果现实中已经结束实验并平行趋势检验表明假设不合理时),通常可以尝试如下做法:
- 放宽平行趋势假设:例如学界的Honest DID为一种在平行趋势假设可能不成立的前提下,进行稳健推断(Robust Inference)和敏感性分析(Sensitivity Analysis)的方法。与直接假设平行趋势成立不同,Honest DID允许实验后平行趋势的违背,但是限制违背程度与实验前趋势(pre-trends)的违背并不存在太大差异或至少有迹可循。
- 条件平行趋势假设:通过匹配等方法寻找满足平行趋势的群体,例如基于实验群体PSM匹配合适的对照组群体,再应用DID进行评估等。
- 三重差分法:在双重差分基础上引入第三个差异维度(不受干预影响)更精确评估政策或干预措施影响的计量经济学方法,但也增加了数据需求和模型复杂性。
5.2.2 其他准实验方法
本文在准实验上着重介绍了双重差分法,此外还有一些断点回归、中断时间序列等类准实验方法可供读者参考。
- 断点回归(Regression Discontinuity Design, RDD)根据某个可观测变量的阈值(断点)划分为实验组和对照组,分析主要集中在断点附近的样本上。断点附近可以认为有局部随机性,即断点附近的样本是否受处置是随机的,并且在是否处置之外的特征上没有系统性差异。
- 中断时间序列(Interrupted Time Series Analysis, ITSA)具体做法为在干预之前,使用不同时间的多次测量来创建一个模型(例如时间序列分析ARIMA模型),该模型可以估计干预介入后的相关指标的虚拟事实。干预后,再进行多次测量,并将关注指标的实际值和模型的预测值之间的平均差作为实验效应的估计。当然中断时间序列同样可应用于多个实验对象并且各个实验对象可在不同时间点接受实验干预(即设计上类似于多基线实验)。此外简单中断时间序列的一种拓展是引入实验变动然后将其反转,并可以选择多次重复此过程。
| 关注「美团技术团队」微信公众号,在公众号菜单栏对话框回复【2024年货】、【2023年货】、【2022年货】、【2021年货】、【2020年货】、【2019年货】、【2018年货】、【2017年货】等关键词,可查看美团技术团队历年技术文章合集。

| 本文系美团技术团队出品,著作权归属美团。欢迎出于分享和交流等非商业目的转载或使用本文内容,敬请注明 "内容转载自美团技术团队"。本文未经许可,不得进行商业性转载或者使用。任何商用行为,请发送邮件至 [email protected] 申请授权。