社会学研究2012.1
例来展示这些假设。安格里斯特等人(Angristetal.,
1996)使用工具变量分析了服兵役(X)是否会对士兵在退伍后的健康状况(Y)产生因果性影响。这里,
服兵役的工具变量是抽签的结果(Z)。当抽到的数字低于某个值则服兵役,而高于这个值则不需服兵役。在这个例子中,安格里斯特及其同事阐述了使用工具变量进行因果推论的几个关键假
设。第一个假设称为
“单位实验效果值稳定假设”(stableunittreatmentvalueassumption)。这意味着每个人的抽签结果不会对他人是否服兵
役产生影响。
①第二个假设就是上面提到的非混淆假设,即抽签的结果和个体的健康之间相互独立。由于这里是随机抽签,
因此这一条件得到满足。第三个假设是“排除性假设”
(exclusionrestriction)。这一假设意味着在因果推论中排除两类人。第一类人是无论抽签结果如何都会服兵役(总是服兵役的人),而第二类人是无论抽签结果如何都不
会服兵役(总是不服兵役的人)。
②第四个假设是“平均因果效果非零”
(nonzeroaveragecausaleffect),即保证如果抽中的号码小,则服兵役的概率就高。最后一个假设是“单调性”
(monotonicity),意味着抽中小数字的人去服兵役的概率要比抽中大数字的人去服兵役的概率
高。③根据这一假设,那些“低数字偏偏不服兵役”而
“高数字偏偏服兵役”
的“叛逆者”就被排除在外了。④根据这些假设,我们回到反事实框架下的因果推论公式,即:T=[π*E(Y1|w=1)+(1-π)*E(Y1|w=0)]-[π*E(Y0
|w=1)+(1-π)*E(Y0|w=0)]
这里由于我们有抽签的机制,π(即服兵役的比例)就等于X(Z=1),
而没有服兵役的比例1-π则等于X(Z=0),而w=X。其中,
X表示是否服兵役,它是Z的函数,而Z表示抽签结果(Z=1表示抽中小号,而Z
=0表示抽中大号)。将它们代入反事实框架下的因果推论公式,我们
①
数学表达式为:如果Z=Z’,那么X(Z)=X(Z’);如果Z=Z’
而且X=X’,那么Y(Z,X)=Y(Z’,X’)。这里Z表示抽签号,而X表示是否服兵役。因为服兵役是根据抽签号决定,所以X可以表示成Z的函数,即X(Z)。②
排除性假设认为对于这两类人,他们的健康结果都和其他通过抽签而服兵役或不服兵役
的人的健康状况相同。其数学表达式为:Y(Z,X)=Y(Z’,X)=Y(X),也就是说,最
后的健康状况是和服兵役与否而不是和抽签号本身直接挂钩的。
③数学表达式为:P[X(Z=1)]>P[
X(Z=0)]。④
这些人在安格里斯特等人的文章中被称为“叛逆者”(defier),因为这里的规定是小数字
服兵役而大数字不服兵役,但他们总是做“相反”的事情,即抽到小数字偏偏不服兵役,
而抽到大数字却偏偏去服兵役。这些人在因果推论中不予考虑。
236
研究述评
倾向值匹配与因果推论:方法论述评
得到:
T=[X(Z=1)*E(Y1|X=1)+X(Z=0)*(E(Y1|X=0)]-[X(Z=1)*E(Y0|X=1)+X(Z=0)*E(Y0|X=0)]
(因果推论公式:工具变量)
由于叛逆者被排除出去,可以假定E(Y0|X=1)=E(Y0|X=0)=0,这进一步将因果关系简化成为:
T=X(Z=1)E(Y1|X=1)-X(Z=0)E(Y0|X=0)
(简化因果推论公式:工具变量)
上述公式右端的各项都是可观测到的,从而使得因果推论得以完成。然而,使用工具变量方法存在诸多限制。首先,我们所推论出的因
果关系被称为“局部平均治疗效果”
(localaveragetreatmenteffect)(Wooldridge,
2002)。这是因为我们最终能够推算出的因果关系仅仅适用于那些遵循“拿到小号服兵役,拿到大号不服兵役”原则的“服从
者”(complier)(Imbens&Angrist,1994),但我们不能考察总是服兵役的人、总是不服兵役的人或叛逆者。其次,工具变量方法能否带来因果推论很大程度上取决于我们能否找到好的工具变量。如果工具变量本身不够好(比如工具变量和我们关心的自变量的联系很弱,或者和某些混淆变量有关系),那么我们的结论就站不住脚了(Boundetal.,1995)。最后,工具变量的实施需要满足一定的随机性以满足非混淆假设。但在社会学研究中,类似于随机抽签这样“完美”的工具变量几乎很少见到。
总之,无论是回归中断设计还是工具变量都不能够像倾向值匹配那样可以方便地应用于基于调查研究的数据分析。回归中断设计需要寻找一个变量“完全决定”个体是否进入实验组或对照组,而工具变量
的方法也需要寻找到合适的工具变量来满足上面列举的诸多条件,这些在调查数据中往往难以满足。正因为如此,在社会学研究中倾向值
匹配的方法要比其他方法更为
“流行”。五、倾向值匹配的局限性
任何统计方法都有其自身的局限性,倾向值匹配也不例外。首先,
在社会学研究中,非混淆假定往往难以满足。以本文开始的实例来说,
237
社会学研究2012.1
受问卷变量的限制,我们很可能没有办法控制一些影响人们上大学的因素(例如个人智力水平)。正因为如此,很多研究会明确说明其结论有效性的前提是非混淆假设成立,
如果假设不成立,结论也会相应受到质疑(Brand&Xie,
2010)。其次,倾向值匹配假定个体之间不存在相互影响,即“单位实验效果值稳定假设”
。该假设也同样会在社会学研究中受到质疑。举例而言,摩根(Morgan,
2001)在研究天主教学校对学生成绩的影响时指出,“单位实验效果值稳定”意味着天主教学校对个体A的影响与其对个体B的影响无关,照此推论,因为彼此互不影响,接触天主教学校教育的人数多少就不是一个需要考虑的问题。换句话说,天主教学校教育对学生成绩的影响和学校人数无关。无疑这和现实情况相左。因此,在利用倾向值匹配去研究组织结构时,研究者需要十分注意这一假设。第三,除上述基本假设之外,倾向值匹配并不考虑变量之间的交互作用而只是关注某个我们关心的自变量的效果,同时和多元回归一样,倾向值匹配也会受到忽略变量(omittedvariables)问题的影响。此外,目前主流统计软件分析的自变量是二分变量(例如上不上大学),而对连续型自变量的探讨还很不成熟。
总体而言,倾向值匹配方法主要应用于效果评估研究中(evalua-tion)。例如上述大学教育对收入的影响以及摩根研究的天主教学校对学生成绩的影响等等。这类问题的一个共同点在于我们在分析数据之前已经预先知道一个二分型的变量对于另外一个变量有因果效应。此外,对那些影响二分变量的混淆变量,我们也应该具有比较清楚的理论支持。在这种情况下,倾向值匹配会比较适用。然而,如果我们对谁“影响”谁不是十分清晰(例如互为因果),或者对于我们需要考虑哪些混淆变量也不了解的话,倾向值匹配就很有可能违反上面提及的前提假设,从而使我们的结论受到质疑。
六、总结及讨论
社会学研究中对因果性的重视使我们日益关注并应用倾向值匹配方法。本文系统梳理了倾向值匹配的历史、发展及其对社会学调查研究的意义,并通过一个具体实例展示了倾向值匹配的实施过程。此外,238
研究述评
倾向值匹配与因果推论:方法论述评
本文从科技哲学理论层面与统计学数理层面论述了为什么倾向值匹配可以帮助我们进行因果推论。然后,本文对比了倾向值匹配与回归中断设计及工具变量方法在因果推论中的应用。最后本文简要陈述了倾向值匹配方法的局限性和适用性。
作为一种新兴统计技术,倾向值匹配还在不断发展。首先,在最近几年中,很多新的匹配技术被开发出来。例如完全匹配方法(fullmatc-hing)可以提高样本的利用率从而保证每个个体都能在匹配过程中被
使用到(Hansen,
2004;Stuart&Green,2008)。遗传性匹配(geneticmatching)则利用人工智能的方法提高匹配效率,其过程甚至不需要计
算具体的倾向值(Sekhon&Mebane,1998)。在未来一段时间内,如何开发新的匹配技术将是统计学家及社会科学家共同努力的方向。其
次,倾向值匹配方法的另一个发展趋势在于对更多研究情景的考虑。例如,新的技术开始被开发出来以考察如何将倾向值匹配应用于自变
量是连续型的情况(Hirano&Imbens,2004),或自变量超过两个取值水平的情况(Lechner&Miquel,
2005)。最后,倾向值匹配和现有统计模型和统计技术也越来越多地结合起来。这方面已有的探索包括将倾向值匹配和分层模型结合起来考察因果效果在不同群体中体现出的异质
性(Brand,2010;Brand&Davis,2011;Brand&Xie,2010),以及利用贝叶斯方法考察倾向值计算的不确定性(An,
2010)。这三个发展趋势预示着倾向值匹配方法会在未来一段时间有更大的飞跃。
参考文献:
彭玉生,2011,《社会科学中的因果分析》,《社会学研究》第3期。
An,Weihua2010,“BayesianPropensityScoreEstimators:IncorporatingUncertaintiesinPropensity
ScoresintoCausalInference.”
SociologicalMethodology40(1).Angrist,JoshuaD.&AlanB.Krueger2001,“InstrumentalVariablesandtheSearchforIdentifica-tion:FromSupplyandDemandtoNaturalExperiments.”JournalofEconomicPerspectives15(4).
Angrist,JoshuaD.&VictorLavy1999,“UsingMaimonides'RuletoEstimatetheEffectofClass
SizeonScholasticAchievement.”QuarterlyJournalofEconomics114(2).
Angrist,JoshuaD.,GuidoW.Imbens&DonaldB.Rubin1996,“IdentificationofCausalEffects
UsingInstrumentalVariables.”JournaloftheAmericanStatisticalAssociation91(434).Becker,
SaschaO.&AndreaIchino2002,“EstimationofAverageTreatmentEffectsBasedonPro-pensityScores.”TheStataJournal2(4).
Black,SandraE.1999
,“Do‘Better'SchoolsMatter?ParentalValuationofElementaryEduca-239
社会学研究
2012.1
tion.”QuarterlyJournalofEconomics114.
Bound,John,DavidA.Jaeger&ReginaM.Baker1995,“ProblemswithInstrumentalVariables
EstimationWhentheCorrelationbetweentheInstrumentsandtheEndogenousExplanatoryVar-iableIsWeak.”JournaloftheAmericanStatisticalAssociation90(430).
Brand,JennieE.&YuXie2010,“WhoBenefitsMostfromCollege?EvidenceforNegativeSelec-tioninHeterogeneousEconomicReturnstoHigherEducation.”AmericanSociologicalReview75(2).
Brand,JennieE.2010
,“CivicReturnstoHigherEducation:ANoteonHeterogeneousEffects.”SocialForces89(2).
Brand,JennieE.&DwightDavis2011,“TheImpactofCollegeEducationonFertility:Evidence
forHeterogeneousEffects.”Demography48(3).
Greenland,Sander2000
,“AnIntroductiontoInstrumentalVariablesforEpidemiologists.”Interna-tionalJournalofEpidemiology29(4).
Guo,Shenyang&MarkW.Fraser2010,PropensityScoreAnalysis:StatisticalMethodsandApplica-tions.CA:SagePublications.
Hahn,Jinyong,PetraTodd&WilbertVanderKlaauw2001
,“IdentificationandEstimationofTreatmentEffectswithaRegression-DiscontinuityDesign.”Econometrica69(1).
Hansen,BenB.2004,“FullMatchinginanObservationalStudyofCoachingfortheSAT.”Jour-naloftheAmericanStatisticalAssociation99(467).
Harding,DavidJ.2003,“CounterfactualModelsofNeighborhoodEffects:TheEffectofNeighbor-hoodPovertyonDroppingOutandTeenagePregnancy.”AmericanJournalofSociology109(3).
Heckman,JamesJ.&JeffreyA.Smith1995
,“AssessingtheCaseforRandomizedSocialExperi-ments.”JournalofEconomicPerspectives9(2).
Heckman,JamesJ.1978
,“DummyEndogenousVariablesinaSimultaneousEquationsSystem.”Econometrica46.
———1979,“SelectionBiasasASpecificationError.”Econometrica47.
Hirano,Keisuke&GuidoW.Imbens2004,“ThePropensityScorewithContinuousTreatments.”
InAndrewGelman&XiaoliMeng(eds.),AppliedBayesianModelingandCausalInferencefromIncomplete-DataPerspectives.NewYork:Wiley.
Holland,
PaulW.1986,“StatisticsandCausalInference.”JournaloftheAmericanStatisticalAsso-ciation81(396).
Imbens,GuidoW.&JoshuaD.Angrist1994,“IdentificationandEstimationofLocalAverage
TreatmentEffects.”Econometrica62(2).
Lechner,Michael&RuthMiquel2005,“IdentificationoftheEffectsofDynamicTreatmentsbySe-quentialConditionalIndependenceAssumptions.”WorkingPaper,SIAW.
Lee,DavidS.&ThomasLemieux2009,“RegressionDiscontinuityDesignsinEconomics.”NBER
WorkingPaperSeries(Retrievedfromhttp://www.nber.org/papers/w14723).
Leuven,Edwin&BarbaraSianesi2003
,“Psmatch2:StateModuletoPerformFullMahalanobis240