因果推断与AB实验

第一节 因果推断引言

相关性和时序性!=因果

伪因果/伪关系

因果之梯三大层级:相关;干预;反事实

辛普森悖论(例如愿意主动参加报名的人本来粘性就高,不能将其参加活动的效果与不主动参加活动的人的效果混为一谈)

因果推断主要工具:

随机对照试验(潜在因果模型)

类试验设计(1.双重差分;2.合成控制;3.断点回归)

非试验场景(1.潜在因果模型)

随机试验与潜在因果模型

用difference in means推断因果效应的重要假设:

(1)实验单元的指标结果不受其他试验对象的状态影响,如网络效应

(2)实验单元之间独立

(3)实验单元是否被放到试验组和指标结果独立-没有选择偏差

准试验设计

1.双重差分法

不要求试验组和控制组完全一致,但要求这种差异不随时间产生变化,也就是说处理组和试验组之间必须具有相同的发展趋势

稳健型检验:增强结论的说服力

平行趋势检验:政策节点之前,处理组和控制组之间不存在平行趋势之外的差异

安慰剂检验:如果随机选择样本作为伪处理组,那么不应该和对照组有差异

2.合成控制法

合成虚拟对照组,缺点:不能作为推断

3.断点回归设计

精准断点回归,模糊断点回归

鲁宾对于观测性数据的因果推断研究(没搞懂嗯嗯)

给定协变量x

A/B试验是什么?

第一类错误:真实没差异,检验出差异(实验显著,上线没效果)

可能是因为检测时间挨得太近导致的

第二类错误:真实有差异,没检测出差异(试验不显著,但策略真的有效果)

可以计算测试需要多少的样本量

相关推荐
yyyyy_abc1 小时前
ceph学习笔记
笔记·ceph·学习
晓梦林1 小时前
ximai靶场学习笔记
android·笔记·学习
IT19952 小时前
Dify笔记-创建自定义工具连接到自建的OpenAPI Schema服务
笔记
一口吃俩胖子2 小时前
【脉宽调制DCDC功率变换学习笔记021】时域性能准则
笔记·学习
starvapour3 小时前
SSH笔记
笔记·ssh
三品吉他手会点灯4 小时前
C语言学习笔记 - 40.数据类型 - scanf函数的编程规范与非法输入处理
c语言·开发语言·笔记·学习
大G的笔记本4 小时前
synchronized 的原理(简单版)
笔记
daad7775 小时前
记录一个希尔伯特曲线笔记
笔记
江屿风6 小时前
C++OJ题经验总结(竞赛)1
开发语言·c++·笔记·算法
wangcheng3036 小时前
AI+制造正悄然改变工业生产
笔记