SPSS课件第8章(5)

2019-06-05 00:22

第二篇 SPSS与统计基础统计分析

即护士每小时薪水在不同年龄段上其均值是显著差异的;但是在例8-2中,护士每小时薪水在不同年龄段上其均值变成不是显著差异的(见表8-12)。这是什么原因呢?为什么同样的观测变量只是多增加一个控制因素,其结论会出现180度的大转折?这些问题我们都将在本节给出答案。在本节中,我们沿用例8-1和例8-2的数据,只是研究方法用协方差分析进行研究。

本节我们依然采用具体例子结合理论模型的方法,以加深读者对协方差分析的理解。

8.4.1 引例:协方差分析的引入和概述

根据上面的问题描述,我们先提出本节的例题:

例8-3 在护士每小时薪水问题中,考察控制变量“工作经验”对控制变量“年龄范围”的影响,并继而检验这两个变量对观测变量每小时薪水的影响。检验当工作经验是已知时,年龄分为对每小时薪水的净作用,指出其是否显著。(数据见光盘8-3.sav) 本例中重点考虑的是控制变量之间的“互相影响的关系”,这在前面的单因素方差分析中由于控制变量只有一个,因而这种影响关系是不可能出现的;在多因素方差分析中这种影响关系可能出现,但是我们还没有考虑,在本节我们就需要重点分析和解决这种控制变量之间的影响关系。

就如本例中的情况一样,其实影响护士每小时薪水的控制变量很可能是“工作经验”,但是“年龄段”和工作经验是密切相关的,如果不考虑工作经验的情况下,检验年龄段对每小时薪水的影响,那么工作经验对薪水的影响就通过年龄段体现出来,从而年龄段对每小时薪水的影响就是显著的。其实质是工作经验对薪水的影响的一种间接表现。因此在同时考虑年龄段和工作经验作为控制变量时,真正对每小时薪水有影响的工作经验各水平上薪水均值显著差异,然而不是直接因素的年龄段各水平上薪水均值就差异不显著了。

协方差分析目的之一就是为了区别这两种情况而引入的方差分析方法。协方差分析的目的就是为了弄清楚控制因素对观测变量的影响到底是直接的影响还是通过某种变量之间的相互关系传递的影响。如果是传递的影响,那么扣除了传递的变量以后,控制因素对观测变量的影响还有多少,是显著还是不显著。

协方差分析目的之二是为了弄明白在控制因素之外其他变量对观测变量的影响。我们选定的控制因素都是容易控制的因素,就好像年龄段、工作检验等,但是实际问题是复杂的,有些变量的不同水平确实会对观测变量的取值产生影响,但是这些变量往往又不是人为可控的,比如护士的工作条件、护士的工作年限等等。因此,为更加准确研究控制变量对观测变量的影响,要尽可能扣除这些不可控变量的影响。为此可以从数据获取上想方法尽量消除这些不可控变量的作用,也可以从方法上着手,在数据分析时从方法上有效消除这些变量的作用,协方差分析就是这种方法。

协方差分析将观测变量的变化归结为四种影响的共同作用:控制变量的各自独立影响、控制变量交互作用的影响、协变量的影响以及随机因素的影响。协方差分析就要在分析观测变量方差时,扣除协变量影响的方差后,再分析控制变量对观测变量的影响。下面我们就来看看协方差分析的数学模型:

单因素协方差分析的数学模型为:

Xij????i??Zij??ij,i?1,2,...,k;j?1,2,...,ni

式中,?i是控制变量各水平对观测变量样本的影响,Zij是协变量对应于观测变量的取值,?是协变量对观测变量的影响系数,而?ij是服从正态分布的随机误差,从模型上看,协变量是间隔尺度变量,

『 22 』 第8章 方差分析

因此协方差分析中,同时涉及间隔尺度和顺序尺度变量,其方法是采用一种类似线性回归的方法,将观测变量总方差中由协变量能够解释的方差扣除,再利用一般方差分析的方法分析控制因素各水平对剩余的方差的组间方差是否显著大于组内方差。

协方差分析的假设检验模型过程:

给定原假设:原假设是协变量对观测变量影响不显著,即?=0;扣除协便利那个影响下,控制变量各水平上观测变量均值无显著差异。

给出检验统计量:检验仍然采用F统计量,统计量的构造为:

Fcov?SSregRSS/(n?2)

FANOVA?(RSS?SSE)/(k?1)

SSE/(n?k?1)式中第一个统计量是检验协变量对观测变量影响显著性的,第二个变量是检验控制变量各水平上观测变量均值是否显著差异的。

式中的SSreg和RSS分别代表回归平方和、残差平方和,是回归分析中的统计量,请读者参看第10章模型显著性检验相关内容,假设检验采用的是先对观测变量和协变量进行回归,检验回归模型是否显著,同时得到残差平方和RSS,RSS中不再含有协变量的信息,但是含有控制变量的影响,再利用RSS进行方差分析,在协方差分析中,观测变量总方差有如下关系:

SST?SSreg?SSA?SSE

其中SSA+SSE=RSS,在原假设为真时,第一统计量服从自由度为1和n-2的F分布,第二统计量服从自由度为k-1和n-k-1的F分布,SPSS会自动计算统计量的观测值并给出相应的概率P值,运用P值就可以完成假设检验了。

8.4.2 协方差分析的SPSS实现

下面我们来看如何进行SPSS协方差分析:

Step1:选择【Analysis】菜单→【General Linear Model】菜单→【Univariate】菜单

在图8-9的主对话框中,Dependent Variable框中代表观测变量,Fixed Factor(s):代表固定效应,即人为可控的控制变量,Random Factor(s):代表随机效应,即人为不可控制,但是取值是有限个,可以作为控制因素的控制变量。Covariate(s):代表协变量,对话框和8.3节介绍的完全相同。只是右边用于多重比较检验的按钮变灰了,说明该功能在协方差分析下不可用。

第二篇 SPSS与统计基础统计分析

此功能不可用 协变量框 图8-9 协方差分析对话框

Step2:选择观测变量、控制变量和协变量

如图所示,将“每小时薪水(hourwage)”选入观测变量Dependent Variable框,将“年龄范围(agerange)”选入控制变量Fixed Factor(s)框,将“工作年限(wkyear)”选入协变量Covariable(s)框中。

Step1:进行其他选项设置

可以看到除了多重比较检验不能进行,其他方差分析的进一步分析都是可以完成的,和多因素方差分析的进一步分析相同,这里就不再选择了。设置完成后点击

完成操作。

8.4.3 协方差分析的结果分析

下面我们看协方差分析的结果,结果显示在表8-17和表8-18中

表8-17 Between-Subjects Factors

Value Label N 1 18-30

年龄范围 2 31-45

3 46-65 463 1581 861 表8-18 每小时薪水Tests of Between-Subjects Effects Source

Corrected Model

Type III Sum of Squares df 8514.775 126080.742 7622.209 1059.284 37210.384 1212465.903 45725.160 a

Mean Square 2838.258 126080.742 7622.209 529.642 12.827

F 221.277 9829.520 594.243 41.292

Sig. .000 .000 .000 .000

3 1 1 2 2901 2905 2904

wkyear agerange Error Total

Corrected Total a. R Squared = .186 (Adjusted R Squared = .185)

『 24 』 第8章 方差分析

从检验结果看,表8-17列出各年龄段护士的样本数,分别是463、1581和861,控制变量各水平上样本数并不相同。表8-18列出协方差分析的统计量观测值和对应P值,和表8-4比较,可以看到总方差基本相同,有差别是因为缺失数据造成的,但是组内方差Error项值为37210.384,比表8-4组内方差Within Groups项值45614.257明显减小,这是因为协方差分析中组内方差即控制变量不能解释的方差中,有一部分被协变量解释了。从统计量结果来看,协变量对观测变量的影响是显著的,P值接近0,而年龄段各水平上观测变量的均值也是显著差异的,P值也接近0。这说明即使扣除工作年限的因素,年龄仍然是影响护士每小时平均薪水的重要因素。

【本章知识点】

单因素方差分析是两独立样本参数检验在多样本情形下的推广。和参数检验一样,单因素方差分析也有适用条件,在满足条件的情况下才能够利用方差分析比较多个总体的均值是否相等。需要注意的是,在方差分析涉及两个变量:观测变量和控制变量,一般来说,观测变量是间隔尺度而控制变量是顺序尺度或名义尺度。

方差分析也是一种假设检验,因此也遵循假设检验的一般步骤,方差分析采用F统计量。读者需要了解方差分析F统计量的构造,理解方差分析中关于总方差的分解,因为这是一种重要的统计思想,在后面的章节中还会反复用到。

多因素方差分析是单因素方差分析的推广,将控制变量由一个变为多个。读者需要注意是多因素方差分析除需要检验单个变量的效应以外,还需要检验变量之间的交互效应,因此,模型更加复杂;另外,多因素方差分析分为完全模型和不完全模型,读者需要了解其中的差别。

协方差分析是分析扣除协变量影响之后,控制变量对观测变量的影响,读者需要了解协方差分析的基本思想。

对于三种方差分析读者需要掌握其SPSS操作和结果解释,特别是对观测显著水平P值的理解。能够运用P值进行进行统计检验,并解决实际问题。

【思考与练习】

1. 方差分析是如何利用方差的分解来说明多个总体均值的差异的?

2. 单因素方差分析适用条件是什么?单因素、多因素、协方差分析其模型有哪些差别?

3. 将协方差分析和一般方差分析(单因素或多因素)想对比,可以说明协变量的影响吗?如何说明?

4. 数据8-4.sav是有关产品销售和广告方式及销售地区的数据,分别以广告方式和销售地区作为控制变量进行单因素方差分析,并完成操作,说明结果。

第二篇 SPSS与统计基础统计分析

5. 基于数据8-4.sav,完成多因素方差分析,并说明结果。

6. 数据8-5.sav是有关养猪体重增加的数据,请将小猪体重作为协变量,进行协方差分析。并与一般单因素方差分析做比较,阐述结果的差异说明了什么?


SPSS课件第8章(5).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:基于导频的ofdm系统的信道估计程序

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: