书名：基本有用的计量经济学
作者名：赵西亮
本章字数：2066字
更新时间：2025-02-26 04:13:21

前言

目前，国内计量经济学的训练（无论是本科生还是研究生）主要集中于统计推断（statistical inference），即如何利用样本信息获得总体信息的估计以及如何进行假设检验以判断估计结果的统计显著性。在经济学实证中，我们拿到的往往是总体的一个样本，利用样本信息进行的估计是否能够反映总体，是实证研究中一个非常重要的问题。但是，统计推断本身往往很少能够给出因果关系的信息。随着信息技术的发展，数据获取的成本越来越低，我们开始进入一个大数据的时代，这意味着我们可以获得的数据样本容量越来越大，甚至可以获得总体信息。这样，统计推断的作用可能就越来越小，比如，如果拿到了总体数据，那么传统意义上的统计推断就没有用武之地了。但是，就算我们有总体数据，也不能回答因果关系的问题。比如，假设我们有中国人口普查的数据，想考察教育如何影响个人收入，仍然是没有办法获得因果效应的知识的。因而，因果效应无关样本大小，对于因果效应的探讨是更加底层的问题，是任何科学获得知识的关键。所以，要获得变量之间因果效应的知识，必须要进行因果推断（causal inference）。

目前，经济学的经验研究正在经历一场研究范式的转变（paradigm shift）（Panhans and Singleton，2016），从统计推断向因果推断转变。越来越多的实证研究开始探讨如何才能科学地识别经济变量之间的因果影响，而非集中于估计量的统计显著性问题，统计推断往往是相对次要的问题（second order problem），而因果推断才是获取知识的首要问题。这种研究范式的转变被Angrist and Pischke（2010）称为经济学经验研究的“可信性革命”，其关键特征是引入潜在结果框架清晰定义因果，利用随机化实验的思想作为因果效应识别的基础，因而新研究范式有时也被称为“以实验设计为基础的计量经济学”或计量经济学的“实验学派”（Angrist and Pischke，2017）。尽管其他计量经济学家并不一定完全认同“可信性革命”的说法，但是，“实验学派”的计量经济学确实使经济学经验研究获得很多“基本有用的经验知识”（Rust，2016）。最近二十多年来，“实验学派”计量经济学方法在经济学经验分析中的影响越来越大，研究范式的“技术进步”也不断在其他学科中“技术扩散”（Bowen et al.，forthcoming），但是在经济学教学中，本科生和研究生所使用的《计量经济学》教材仍然沿用了老的研究范式，在经济学经验研究文献中广泛采用的因果推断方法仍然没有进入《计量经济学》教科书。Angrist and Pischke（2017）指出，传统计量经济学教材中的很多指导是过时的，比如有关异方差、序列相关等问题的讨论，这些问题都不会影响因果效应的识别，而这些问题的解决只需要利用White（1980）的异方差一致性标准误差或Newey and West（1987）的序列相关及异方差一致性标准误差进行修正。Angrist and Pischke（2017）提议新的研究范式更加有趣、相关性更强、识别结果更加令人满意，为什么不能让我们的学生也获得这些技能呢？

本书顺应了Angrist and Pischke（2017）的号召，将经济学经验研究新范式介绍给我们的学生。本书分成两大部分：理论基础和识别策略。理论基础部分，首先介绍潜在结果框架。潜在结果概念的引入，便于清晰定义因果效应，从而避免Lord悖论。然后，介绍随机化实验。随机化实验是所有识别策略的基础，本书介绍的所有识别策略在一定的识别条件下都可以看作是一种随机化实验。另外，我们还介绍了因果图。因果图是与潜在结果框架完全等价的因果模型（Pearl，2009），但是更加直观。

第二部分主要介绍了经济学经验研究中常见的几种识别策略。首先是线性回归，主要关注在什么样的识别条件下，线性回归系数可以解释为因果效应参数。我们强调在线性回归中，我们关心的解释变量和其他控制变量的地位是不同的，其他控制变量的引入是为了识别我们关心的解释变量的因果效应，为强调这一点，我们将关心的解释变量称为原因变量或干预变量。然后，我们讨论了匹配方法的识别条件。线性回归和匹配方法有着密切的联系，具有相同的识别条件。我们强调回归和匹配的识别条件都是CIA，都不能解决内生性问题。接着是工具变量法。工具变量法是经济学中一种相对比较成熟的方法，但是利用潜在结果语言和引入异质性之后，工具变量法有了新的内涵，工具变量所能识别的因果效应参数是依从者的因果效应，并且在异质性框架下，不同的工具变量识别不同的因果效应参数。在有多期数据的情况下，可以利用多期数据的特点，消除不随时间变化的混杂因素的影响，从而使双重差分法模拟增量上的随机化实验。另外，我们还讨论了可以允许时变混杂因素的合成控制法和回归控制法。最后，我们讨论了最接近完全随机化实验的一种识别策略——断点回归设计（RDD），它利用断点附近个体具有高度相似性的特点来识别因果效应。另外，对最新发展的弯折回归设计（RKD）也进行了简要介绍。

本书主要根据我为厦门大学经济学院研究生和高年级本科生开设的“应用微观计量经济学”课程讲义修改而成。本书的主要特色是利用潜在结果语言和因果图讲解各种识别策略，另外辅以具体案例讲解各种识别策略在Stata软件中的实现。适合从事经济学经验研究的学者和本科生、研究生使用，也适合从事社会学、政治学、流行病学等相关学科研究的学者作为因果推断方面的参考书。限于作者水平有限，时间紧迫，定有很多错漏之处，欢迎读者批评指正。

赵西亮

2017年2月20日