王保进 多变量分析 MANOVA -10

2018-11-28 16:55

多变量方差分析(MANOVA)

第一节 基本原理

多变量方差分析(MANOVA)可以说是单变量方差分析(ANOVA)之扩大,目的也是在检验自变量不同处理水平或类别的样本在等距以上因变量的测量值的差异情形,或是诸如“样本在多个Y变量上的得分(表现)不因X变量的不同哦你个人有显著差异”的假设。但单变量方差分析一次仅处理一个因变量,而多变量方差分析则一次可以处理多个因变量。两种方法在因变量数目的不同,使得假设检验就有所不同,在ANOVA是,检验k个实验处理样本在一个因变量平均数差异的零假设为:

H0:?1??2????k

而在MANOVA时,检验k个实验处理样本在p个因变量平均数差异的零假设为:

??11???12???1k??????????2122?????2k? H0???????????????????????????p1p2??????pk??有关ANOVA的基本原理,读者可以参阅王保进(2001),至于MANOVA的基本原理,以下分别说明。

一、基本假设

在进行ANOVA时,必须符合包括:

① 观测值要独立(independence);

② 样本所来自的总体在因变量上的概率分布呈正态分布(normality);

③ 方差齐性(homogeneity of variance)等三个基本假设,分析结果才具有效度。同样的,在进行MANOVA时,也必须符合下列三个基本假设:

(一) 独立性

所谓独立性是指总体中各样本在因变量上的测量值应该要彼此独立,没有相关存在。违反独立性的假设最常出现在时间系列(time series)的纵贯性调查中,或是一群具有相同背景条件(例如同样处在噪音的环境中)的观测值,以致对某些因变量测量表现出相似的反应(Hair et al., 1998;Stevens, 1992)。违反独立性的假设是MANOVA中最严重,也是最应该避免的假设,因此研究者应该尽可能的加以检验并做必要的校正,唯目前对违反独立性假设的检验还缺乏一致性的检验方法。当出现观测值分数彼此相关时,可行的校正方法是以平均数来代替一群具相同北京条件的观测值分数,或是将该可能干扰源作为另一个自变量,进行区组设计(blocking design);当然,采取更小的?值(如0.01),也可以解决部分的问题。

(二) 正态性

在ANOVA时,正态性的假设是指样本所来自的总体,在因变量上的概率分布呈正态分布.而MANOVA的正态性假设,则是指样本所来自的总体在多个因变量上的概率分布呈多变量正态分布(multivariate normal distribution ),亦即两个以上的因变量的联合概率密度函数(joint probability density function)呈现正态分布.多变量正态分布几乎是所有多变量分析统计方法共同的基本假设,但目前仍缺乏一个有效的检验方法(Hair et al . , 1998;Tabachnick&Fidell,2001),一般都是对个别因变量分别进行正态性假设检验,若全部因变量均符合正态假设,则就算无法确定符合多变量正态分布的假设但造成之偏误在具鲁棒性(robustness) 的F检验下,特别是采用大样本时,都可以不予以理会. (三) 方差协方差齐性

36

在ANOVA时,因为只处理一个因变量,所以只要来自同一整体的各实验处理组样本在因变量得分的方差具有齐性,即??????即可.但在MANOVA时,因为同时处理多个因变量,所以除了实验处理各组样本在各因变量得分的方差外,还可以计算各因变量间的协方差,因此MANOVA必须符合方差协方差齐性的假设.有关方差协方差齐性的假设最常用的检验方法就是Box(19540根据Bartlett-Box单变量齐性检验法所类化发展的检验方法,惟此一方法对正态性的假设相当敏感,因此在使用时必须先确定因变量符合正态性的假设.Stevens(1992)指出,Box检验法的结果近似卡方分布或F分布,当全部样本数大于20,因变量数在六个以下及实验处理数在六组以下时,以采用卡方分布检验值较为精确,其他情形则以F分布检验值较为可靠.

二 假设检验步骤

MANOVA的假设检验的原理与ANOVA几乎是相一致,都必须先决定方差来源,然后计算每一个方差来源的方差量.不同的是,在ANOVA时,因为因变量只有一个,所以只要计算离均差平方和即可;但在MANOVA时,因为因变量在一个以上,因此除了离均查平方的计算外,也需计算因变量彼此间的交叉乘积(crosspruduct).为此,方差来源方差量的计算,就必须改以矩阵的方式来表示,亦即”离均查平方和交叉乘积(SSCP)矩阵”[有关SSCP的计算,请参阅王保进(2001)].以下根据自变量个数与实验处理组数的多寡,将MANOVA的假设检验方法分别说明如下.

第四节 多组样本多变量平均数的显著性检验

由于Hotelling’s

检验只适用于两组样本的多变量平均数差异检验,若是碰到自变量分为三个处理

检验就不再适用,而必须改用多变量方差分析(MANOVA)的方

水平(组)或三组以上时,Hotelling’s

法,多变量方差分析根据研究者所操作自变量个数的多少,可以分为单因子(一个自变量)及多因子(两个以上自变量)MANOVA。虽说MANOVA不限制研究者选择自变量的个数,当自变量越多,则模型就变得越复杂,除了造成研究取样及操作的不方便外,当自变量间的效果有交互作用(interaction)产生时,解释也极为困难,因此一般在行为科学的研究中,自变量的个数通常不超过三个。本节就以实际的例子说明如何利用SPSS统计软件进行案例分析,并解释报表结果。

一、 单因子MANOVA检验

SPSS窗口12.0版用来处理MANOVA的对话框是General Linear Model下的Multivariate指令对话框。以下以一个假设性资料为例2-2,说明如何利用Multivariate指令对话框,进行MANOVA检验。 例2-2(资料档为EX2-2.SAV)

有一社会学家想了解不同社会发展程度国家在:(一)都市化程度;(二)预期寿命;(三)成人识字率;(四)婴儿死亡率;(五)人均GDP;(六)每十万人口AIDS数;(七)高等教育普及率等七个社经发展相关指标上的发展程度是否有所差异,乃利用联合国的统计年鉴资料,搜集四十八个不同发展程度国家在七个相关指标上的现状。试问不同社经发展程度国家在七个指标的差异情形如何? (一) 操作程序

37

根据例2-2,由于问题在检验三种不同社会发展程度(自变量)国家在七个社经发展指标上的差异情形,自变量共有三种类别,而因变量则是七种指标,因此可以进行单因子MANOVA。 原始资料如图2-12.

图2-12 例2-2的原始资料

进行MANOVA分析时,在数据档读进SPSS资料编辑窗口后,应开启分析(Analyze)菜单的General Linear Model 下的Mulitivariate 指令的对话框,并在来源变量清单中,点击七个因变量 urban、lifeexpf、literacy、babymor、gdp_cap、aids_rt、he,并移至Dependent Variable的方格中,并将自变量group移至Fxed Factor的方格中,如图2-13。

其次,点击图2-13的Post Hoc语句的按钮,开启对话框,点击事后比较方法(本例选择LSD及Ducan法说明),再按Continue钮回到图2-13的对话框。最后,再点击图2-13中Options语句的按钮,开启其对话框,并点选其中的描述统计(Descriptive statistics)与齐性检验(Homogeneity test)等两个选项,再按Continue钮回到图2-13的对话框。

完成上述界定工作后,使用者只要点击图2-13中的OK按钮,SPSS即会执行

38

图2-13 完成自变量与因变量界定的Multivariate 指令的对话框

单因子MANOVA的统计分析,并自动开启结果输出窗口,将统计分析结果输出到窗口中。

综合上述操作程序,可将三种不同社会发展程度(自变量)国家在七个社经发展指标上差异性检验的MANOVA检验的程序摘要如下:

Analyze

General Linear Model

Multivariate??界定因变量与自变量 Post Hoc??界定事后比较方法

Options??点击输出描述统计量与齐性检验 OK按钮??执行统计分析

(二)报表解释

当使用者点击OK 按钮执行统计分析,则SPSS会自动开启结果输出窗口,将统计分析结果输出到窗口中。例2-2执行的结果与报表解释如下:

Between-Subjects Factors分组变量123Value Label欠发达国家发展中国家发达国家N82812 39

SPSS所输出自变量“发展程度”的观测值个数统计,因数据档中已将编码值界定标签,因此在Value Label一栏中,会分别输出自变量编码值的标签。其中1代表“欠发达国家”有8个,2代表“发展中国家”有28个,3代表“发达国家”有12个。

SPSS所输出不同社经发展程度国家在七个 (因变量)的描述统计结果(见下表)。相关解释参见例2-2,此处不再赘述。值得注意的是“发达国家”在多个因变量的标准差都是最小,这是研究者可以解释或推测可能原因,以作为进一步研究的方向。

Descriptive Statistics分组变量MeanStd. DeviationN都市化程度欠发达国家33.1311.8378发展中国家59.1817.50428发达国家78.088.22912Total59.5620.47848预期寿命欠发达国家55.06255.716138发展中国家69.25004.0540328发达国家77.2500.9170112Total68.88548.0604448成人识字率欠发达国家44.389.9708发展中国家82.3912.68228发达国家98.501.44612Total80.0820.35948婴儿死亡率欠发达国家91.80021.31088发展中国家37.55419.316928发达国家6.442.911012Total38.81732.071548人均gdp欠发达国家737.75620.2338发展中国家3040.822230.64128发达国家17368.751894.36112Total6238.966828.40248每十万人口艾滋病人数欠发达国家33.007876.629108发展中国家7.64929.7643728发达国家24.240519.1607612Total16.023533.5167348高等教育普及率欠发达国家11.250011.548048发展中国家29.214314.8357928发达国家59.08337.7864512Total33.687520.5614348

40


王保进 多变量分析 MANOVA -10.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:妇联主任述职述廉报告(范本)

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: