- 社会科学因果推断的理论基础
- 胡安宁
- 835字
- 2020-12-10 19:33:45
2.4 倾向值匹配的局限性
任何统计方法都有其自身的局限性,倾向值匹配也不例外。在本节中,笔者将简要探讨倾向值匹配方法的一些局限性。
第一,在社会学研究中,非混淆假定往往难以满足。以本书开始的实例为例,受到问卷变量的限制,我们很有可能没有办法控制一些影响人们上大学的因素(例如个人智力水平)。正因为如此,很多研究会明确说明其结论有效性的前提是非混淆假设成立,如果假设不成立,结论也会相应受到质疑(Brand & Xie 2010)。
第二,倾向值匹配假定个体之间不存在互相影响,即“单位实验效果值稳定”(the stable unit treatment value assumption)。这个假设也同样会在社会学研究中受到质疑。举例而言,摩尔根(Morgan 2001)在研究天主教学校对于学生成绩的影响时指出,单位实验效果值稳定意味着天主教学校对于个体A的影响与其对个体B的影响无关,照此推论,因为彼此互不影响,接触天主教学校教育的人数多少就不是一个需要考虑的问题。换句话说,天主教学校教育对于学生成绩的影响和学校人数无关。这个推论无疑和现实情况相左。因此,在利用倾向值匹配进行组织研究时,研究者需要十分注意这一点。
第三,除了上述的基本假设之外,倾向值匹配并不考虑变量之间的交互作用而只是关注某个我们关心的自变量的效果。同时,和多元回归一样,倾向值匹配也会受到忽略变量(omitted variables)问题的影响。
总体而言,倾向值匹配方法主要应用于效果评估(evaluation)研究中。例如上面提到的大学教育对收入的影响,摩尔根研究的天主教学校对于学生成绩的影响,等等。这类问题的一个共同特点在于我们在分析数据之前已经预先知道一个二分型的变量对于另外一个变量可能具有因果效应。此外,对于那些影响二分变量的混淆变量,我们也应该具有比较清楚的理论支持。在这种情况下,倾向值匹配会比较适用。然而,如果我们对于“谁影响谁”不是十分清晰(例如互为因果),或者对于我们需要考虑哪些混淆变量也不了解的话,倾向值匹配很有可能违反上面提及的前提假设,从而使得我们的结论受到质疑。因此,模型的不确定性应当成为应用倾向值匹配方法时需要特别注意的一个问题。