倾向值匹配与因果推论(3)

2018-11-21 15:13

研究述评

倾向值匹配与因果推论：方法论述评

我们需要引入反事实框架（counterfactualframework）这一统计学理论。反事实（counterfacts）是指相反情境下的某种状态。例如，一群病人在一个实验中被分到实验组接受新药物治疗。这些人症状的减轻或加重

是我们能够观察到的“事实”。而“反事实”则是指“假设”这同一群病人当时不是被分到实验组而是对照组，即没有接受新药物治疗，那么他

们的症状会是什么样子。自变量（新药）对于症状的因果性效果在统计学意义上就是指这“同一群人”在实验组时的症状和在对照组时的症状之间的差异。换句话说，统计学上的因果关系是可观察到的“事实”与其“反事实”之间的差异。从反事实的框架出发，因果性的关系可以表示为：

Τ=π［

E（Y1|w=1）－E（Y0|w=1）］+（1－π）［E（Y1|w=0）－E（Y0|w=0）］=［πE（Y1|w=1）+（1－π）（E（Y1|w=0）］－［πE（Y0|w=1）+（1－π）E（Y0|w=0）］

（反事实框架下的因果推论公式）

在这个公式里，Τ是指因果关系；π是指所有调查对象中在实验组

中的比例，而1－π也就表示了所有调查对象中在对照组的比例（例如1/3是大学生，那么π=1/3，而没上大学的人的比例就是1－π=2/3）；w是一个二分变量，其中1代表个体在实验组而0代表个体在对照组；Y1和Y0分别指代实验组和对照组的成员在因变量上的取值。E

则是取平均值的意思。在上述公式中，

E（Y1|w=1）或E（Y0|w=0）是可观测到的事实，而E（Y1|w=0）和E（Y0|w=1）则是反事实。

①因果关系T就表示为实验组中的个体其“事实”与“反事实”之间的差

异—

——即E（Y1|w=1）－E（Y0|w=1）———与对照组中的个体其“事实”与“反事实”之间的差异———即E（Y1|w=0）－E（Y0|w=0）———的加权平均值（权重分别为π和1－π）。但问题在于，我们永远也不可能观测到反事实是什么，因为在某项特定的研究中，某一群人只可能在实验组或对照组，而不能同时在两组

中出现。这被称为

“因果推论的基本问题”（Holland，1986）。为了做出①

这里，E（Y1|w=0）是指在对照组中的人“如果”被放置在实验组时所得到的因变量均值。而E（Y0|w=1）则是指在实验组中的人“如果”被放置在对照组内的话所得到的因

变量均值。

231

社会学研究2012．1

因果推论，我们需要用可观测到的E（Y1|w=1）和E（Y0|w=0）来简化上面的因果推论公式。具体而言，我们希望能够满足以下条件，这在统计学上称为

“非混淆假设”（unconfoundednessassumption）：E（Y1|w=0）=E（Y1|w=1）以及

E（Y0|w=0）=E（Y0|w=1）

（非混淆假设）

不难看出，如果满足非混淆假设，反事实框架下的因果推论公式就简化为：

T=E（Y1|w=1）－E（Y0|w=0）

（简化因果推论公式）

如果简化因果推论公式右边的两项均能观测到，我们就能做出因果性结论，

因此，从反事实框架出发，能否做出因果推论主要取决于非混淆假设是否满足。①随机化是统计学中常用的办法，由于实验个体是通过随机方式分配到实验组和对照组中的，

w本身就和最后的实验结果Y1或Y0没有关系了。②换句话说，无论w=0还是w=1，E（Y1）或E（Y0）的值都是固定的，进而E（Y1|w=0）=E（Y1|w=1）且E（Y0

|w=0）=E（Y0|w=1）。但是，对基于调查资料的社会学研究来讲，我们做不到随机化。为了满足非混淆假设，我们能做的是尽可能控制混

淆变量，

并保证这些变量一旦被控制起来，w就能够近似地和Y1或Y0保持独立，换句话说，我们希望做到：

E（Y1|w=0，X）=E（Y1|w=1，X）以及E（Y0|w=0，X）=E（Y0|w=1，X）（非混淆假设：控制变量）上式表明，只要能够找到并控制混淆变量X，我们就能够近似地做到w独立于Y。在倾向值匹配中，所有的这些X通过Logistic回归总结成为一个特定的倾向值P，而非混淆假设就是通过控制倾向值P来满足的。即：

E（Y1|w=0，P）=E（Y1|w=1，P）以及E（Y0|w=0，P）=E（Y0|w=1，P）

（非混淆假设：控制倾向值）至此，通过控制倾向值，我们可以“近似地”满足统计学反事实框

①

当然，在反事实框架下的因果推论还预设了其他条件，比如个体之间没有相互影响（sta-bleunittreatmentvalueassumption）等。这些预设的前提条件会在下面的讨论中提到（具

体可以参阅Guo＆Fraser，

2010；Morgan＆Winship，2007）。②

根据大数定理，个体的各种不可控差异，在随机分配过程中被平均了。换句话说，两组人

可以近似地被认为

“总体上同质”。232

研究述评

倾向值匹配与因果推论：方法论述评

架下的非混淆假设从而做出因果推论。之所以说“近似”，是因为控制

倾向值的效果毕竟不是真正的随机化。很多时候我们很难知道是否已经控制了需要控制的

“所有”混淆变量。正因为如此，在完成倾向值匹配以后我们通常需要进行敏感性分析。在这个意义上说，倾向值匹配只是努力地满足反事实框架下的因果推论条件，

但即使如此，我们也已经从统计学意义上理解了倾向值匹配为什么能够帮助我们得出因果性结论。

四、倾向值匹配与其他社会科学方法的比较

以上分析从科技哲学及统计学的角度阐释了为什么通过倾向值匹

配可以得到因果性结论。然而，因果性分析的方法并不局限于倾向值匹配，

在教育学及计量经济学领域中有很多其他的方法可以帮助我们建构因果关系。在以下讨论中，我将把倾向值匹配与回归中断设计和工具变量进行比较以展示倾向值匹配的优势。（一）倾向值匹配和回归中断设计

在教育学中应用比较广泛的因果推论方法是

“回归中断设计”（re-gressiondiscontinuitydesign）。该方法最先由两位美国学者在1960（Thistlethwaite＆Campbell，1960）提出。在他们的研究中，两位学者关心的是学习上的荣誉奖励（原因）是否能够提升学生未来的学术成就（结果）。这里的荣誉奖励是根据考试成绩而定的：当考试成绩x超过一定分数c，则给予奖励（D=1），否则（x＜c时）则没有奖励（D=0）。通过这种操作，我们就在我们所关心的自变量那里建立了一种“中断”（c之上和之下）。随后如果学生的学术成就也发生了类似的中断（例如考试成绩在c以下学生的学术成就低于考试成绩在c以上的学生的学术成就），则可以认为奖励和学术成就之间有因果关系。图1用图示的方式表达了这种关系。

在图1中，x在c处的中断对应于因变量Y的中断，这种中断τ代

表了x对于Y的效果。从反事实框架来看，回归中断设计满足了非混淆假设。在上面的荣誉奖励例子中，一个人得到荣誉奖励可以理解为

一个人进入了实验组，而这“完全”取决于学生的考试分数x（分数高就

233

社会学研究2012．1

注：横坐标（X）代表考试成绩，纵坐标（Y）代表学术成就。图片来源：Lee＆Lemieux，

2009。图1回归中断设计的基本逻辑

有奖励而分数低则没有奖励）。因此，只要我们控制了分数x，

w（是否得到奖励）就和因变量Y1（得到奖励的学生的学术成就）以及Y0（没有得到奖励的学生的学术成就）独立了。用公式可以表述如下：

E（Y1|w=0，x）=E（Y1|w=1，x）以及E（Y0|w=0，x）=E（Y0|w=1，x）

（非混淆假设：回归中断设计）这里我们可以将回归中断设计与倾向值匹配进行一下比较。倾向值匹配将对多个混淆变量的控制转化为对“单一倾向值”

的控制，以此满足非混淆假设。而回归中断设计则是通过控制一个变量（如上例中的考试成绩）就能完成这一点。回归中断设计之所以不需要考虑多个混淆变量就在于一个个体是否能够接受某个自变量的影响（即能否得到奖励）完全取决于单一变量x（考试成绩）。换句话说，回归中断设计中只有一个混淆变量x。然而，在社会学的调查研究中很难找到这种“单一混淆变量”的情况。正因为如此，回归中断设计在社会学中的应

用远不及在教育学中普遍（Angrist＆Lavy，

1999；Black，1999）。此外，回归中断设计的另一个缺陷在于：如果存在其他自变量也出现某种

“中断”的情况，我们就很难知道什么原因造成了因变量取值的中断。假设一个人是否获奖不仅仅与考试成绩在临界点上下有关（x＞c或234

研究述评

倾向值匹配与因果推论：方法论述评

x＜c），也和年龄有关（例如年龄大的人容易获奖，而年龄小的人很难获奖），则回归中断设计就无法探究荣誉奖励本身对未来学术成就的影响（因为学术成就的中断也有可能是因为年龄不同）（Hahnetal．，2001）。在社会学研究中，类似的多重中断并不少见，这也使得回归中断设计的应用范围受到限制。（二）倾向值匹配和工具变量

除了回归中断设计，在经济学及传染病学领域应用比较广泛的另

外一个方法是工具变量（instrumentalvariable）（Angristetal．，1996；An-grist＆Krueger，2001；Greenland，2000；Martensetal．，2006；Newhouse＆McClellan，1998）。假定我们希望探索变量X对Y的因果关系，混淆变量U的存在会影响我们的研究。这时我们寻找到一个工具变量Z，该变量的特点在于和X相关，但不和Y直接相关（除非是通过X），同时Z也不与混淆变量U相关。这样，我们就不直接考察X是否能影响Y，而是转而考察Z对Y的影响。如果Z很明显地影响了Y，我们就能得出X影响了Y的结论。工具变量的基本逻辑表示如图2。

图2工具变量的基本逻辑

通过图2我们很容易理解工具变量的基本逻辑，由于混淆变量U和X互相影响，我们很难直接探索X对Y的“纯”作用。所以我们找到工具变量Z。Z和Y的关系只能通过X，因此如果我们能够发现Z对Y有作用，我们就能间接得出结论说X对Y有作用，从而确定了一种因果关系。

从严格的统计学意义上来说，利用工具变量进行因果推论需要满

足很多假设条件（Imbens＆Angrist，

1994）。这里可以通过一个经典实235

共5页:

倾向值匹配与因果推论(3).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档