1.2 因果识别和因果效应估测

在1.1节中其实已经介绍了两种最基本的因果识别的方法:利用结构因果模型下的后门准则或者潜结果模型中的三个基本假设,通过一些推导就可以做到对ATE和CATE的因果识别。我们知道,无论是后门准则还是潜结果框架下的强可忽略性,都依赖于不存在没有观测到的混淆变量这一点。而这一点可能在现实世界的数据集中很难被满足。因此,本节将介绍其他几种因果识别方法来克服这一局限性:工具变量(instrumental variables,IV)、断点回归设计(regression discontinuity design,RDD)和前门准则。

有时一个因果识别的方法会与一个估测的方法一同出现,但这并不意味着它们一定需要一起使用。事实上,因果识别跟估测应该是可以分开的两个步骤。在达到因果识别之后,因果效应估测就只剩下估测这一步。估测实际上就是一个普通的监督学习(supervised learning)问题,也可以说是分类或者回归问题(取决于结果变量是离散的还是连续的)。可以说,因果效应估测=因果识别+估测。