Pair 1 G1 - G2 812.50 546.25 193.13 355.82 1269.18 4.21 7 .004 配对t检验表,给出最终的检验结果,由上表可见P=0.004,故可认为两种饲料所得肝中维生素A含量有差别,即维生素E缺乏对大白鼠肝中维生素A含量有影响。
三、相关分析
实证研究中经常要遇到分析两个或多个变量间关系的情况,有时是希望了解某个变量对另一个变量的影响强度,有时则是要了解变量间联系的密切程度,前者用回归分析来实现,后者则需要用到相关分析实现。 同描述统计分析一样,相关分析可以通过许多不同的软件实现,下面同样用常用的SPSS软件介绍相关分析的实现过程。
SPSS的相关分析功能被集中在Statistics菜单的Correlate子菜单中,他一般包括以下三个过程:
?
Bivariate过程:此过程用于进行两个/多个变量间的参数/非参数相关分析,如果
是多个变量,则给出两两相关的分析结果,这是Correlate子菜单中最为常用的一个过程,实际上我们对它的使用可能占到相关分析的95%以上。计算指定的两个变量间的相关系数,可以选择Pearson相关、Spearman等级相关和Kendall相关。同时对相关系数进行假设检验,可选择进行单尾或双尾检验,给出相关系数为0的概率。当资料不服从双变量正态分布或总体分布未知,或原始数据是用等级表示时,宜用Spearman等级相关和Kendall相关。
?
Partial过程:如果需要进行相关分析的两个变量其取值均受到其他变量的影响,
就可以利用偏相关分析对其他变量进行控制,输出控制其他变量影响后的相关系数,这种分析思想和协方差分析非常类似。Partial过程就是专门进行偏相关分析的。
?
Distances过程:调用此过程可对同一变量内部各观察单位间的数值或各个不同变
量间进行距离相关分析,前者可用于检测观测值的接近程度,后者则常用于考察预测值对实际值的拟合优度。该过程在实际应用中用的非常少。
3.1.Bivariate过程 3.1.1.界面说明
从SPSS的“Analyze”->“Correlate”->“Bivariate”,进入二元变量相关分析过程的主对话框,如图3.1所示。
图3.1 二元变量相关分析过程的主对话框
【Variables框】:用于选入需要进行相关分析的变量,至少需要选入两个。
【Correlation Coefficients复选框组】:用于选择需要计算的相关分析指标,有:
? Pearson复选框:选择进行积距相关分析,即最常用的参数相关分析 ? Kendall's tau-b复选框:计算Kendall's等级相关系数
? Spearman复选框:计算Spearman相关系数,即最常用的非参数相关分析(秩相关)
【Test of Significance单选框组】:用于确定是进行相关系数的单侧(One-tailed)或双侧(Two-tailed)检验,一般选双侧检验。
【Flag significant correlations】:用于确定是否在结果中用星号标记有统计学意义的相关系数,一般选中。此时P<0.05的系数值旁会标记一个星号,P<0.01的则标记两个星号。
【Options钮】:弹出Options对话框,选择需要计算的描述统计量和统计分析:
? Statistics复选框组:可选的描述统计量。它们是:
(1)Means and standard deviations每个变量的均数和标准差
(2)Cross-product deviations and covariances各对变量的交叉积和以及协方差阵
?
Missing Values单选框组 定义分析中对缺失值的处理方法,可以是具体分析用到
的两个变量有缺失值才去除该记录(Exclude cases pairwise),或只要该记录中进行相关分析的变量有缺失值(无论具体分析的两个变量是否缺失),则在所有分析中均将该记录去除(Excludes cases listwise)。默认为前者,以充分利用数据。
3.1.2.分析实例
请计算SPSS自带的样本数据judges.sav中意大利(judge1)和韩国法官(judge2)得分的相关性。
解:由于judge1和judge2的数据分布不太好,这里同时计算Pearson相关系数和Spearman相关系数。操作如下:
1. Variables框:选入judge1、judge2 2. Pearson复选框:选中 3. Spearman复选框:选中 4. 单击OK钮 3.1.3.结果解释
上例的输出结果如表3.1和表3.2所示。
表3.1 变量间Pearson相关分析
在上面的结果中,变量间两两的相关系数是用方阵的形式给出的。每一行和每一列的两个变量对应的格子中就是这两个变量相关分析结果结果,共分为三列,分别是相关系数、P值和样本数。由于这里只分析了两个变量,因此给出的是2*2的方阵。由上表可见judge1、judge2自身的相关系数均为1(of course),而judge1和judge2的相关系数为0.91,P<0.001,有非常显著的统计学意义。
表3.2 变量间Spearman相关分析
表3.2内容和上面Pearson相关系数的结果非常相似,只是表格左侧注明为Spearman等级相关。可见judge1和judge2的等级相关系数为0.92,P<0.001,有非常显著的统计学意义。
3.2.Partial过程 3.2.1.界面说明
从SPSS的“Analyze”->“Correlate”->“ Partial”,进入偏相关系数分析过程的主对话框,如图3.2所示。
图3.2 偏相关系数分析过程的主对话框
【Variables框】:用于选入需要进行偏相关分析的变量,至少需要选入两个。 【Controlling for框】:用于选择需要在偏相关分析时进行控制的协变量,如果不选入,则进行的就是普通的相关分析。
【Test of Significance单选框组】:意义同前,用于确定是进行相关系数的单侧(One-tailed)或双侧(Two-tailed)检验,一般选双侧检验。
【Display actual significince level复选框】:用于确定是否在结果中给出确切的P值,一般选中。
【Options钮】:弹出Options对话框,选择需要计算的描述统计量和统计分析:
? Statistics复选框组 可选的描述统计量。它们是:
(1)Means and standard deviations每个变量的均数和标准差 (2)Zero-order correlations给出包括协变量在内所有变量的相关方阵
?
Missing Values单选框组 定义分析中对缺失值的处理方法,可以是具体分析用到
的两个变量有缺失值才去除该记录(Exclude cases pairwise),或只要该记录中进行相关分析的变量有缺失值(无论具体分析的两个变量是否缺失),则在所有分析中均将该记录去除(Excludes cases listwise)。默认为前者,以充分利用数据。
3.2.2.结果解释
偏相关分析的结果和普通相关分析几乎完全相同,非常容易看懂,比如说我们要在排除变量judge3的影响后计算变量judge1和judge2的相关性(只是举个例子而已,这样是没有实际依据的),则结果表3.3。
表3.3 judge1和judge2偏相关分析结果(控制变量:JUDGE3)
JUDGE1 1.0000
JUDGE1
(0) P= . .5632
JUDGE2
(0) P= .000
(Coefficient / (D.F.) / 2-tailed Significance);
表3.3结果中,显示了偏相关系数、自由度和相关系数对应的显著性P值,结果表明在控制JUDGE3情况下,judge1和judge2的相关系数为0.5632,P=0.000,可见当控制了变量judge3的影响后,judge1和judge2的相关系数值大大降低,但仍然具有统计学意义上的相关性。
3.3.Distances过程
JUDGE2 .5632 (297) P= .000 1.0000 (297) P= .