5.1.2 其他常用统计图 5.1.2.1 散点图 5.1.2.2 线图 5.1.2.3 饼图 5.1.2.4 面积图 5.1.2.5 直方图 5.1.2.6 其他
P-P图和Q-Q图都是用来观察变量是否服从正态分布的;质量控制图则用来观察个体值是否有超过正常值范围的情况出现;箱式图的作用和它类似,只是换了一种表达方式;其余的几种图几乎都是用与时间序列模型的。
第三章 均数间的比较 --Compare Means菜单
在计算机领域中有个著名的80/20规则,也就是在奔腾及更早的CPU所采用的CISC指令集中,有80%的任务是被20%的最常用指令所完成的;换言之,另外80%的复杂指令只完成20%的不常用任务。
好了,言归正传。现在我要非常高兴的向大家宣布:80/20规则在SPSS的使用中同样有效!仅以Analyze菜单为例,其中最常用的子菜单为:
? Discriptive Statistics ? Compare Means
? General Linear Model(第一项) ? Correlate
? Regression(前半截) 只要掌握了它们的使用秘籍,你就可以理直气壮的宣称你已经可以用SPSS解决80%的统计学难题。 §7.1 Means过程
Means过程的优势在于各组的描述指标被放在一起便于相互比较,并且如果需要,可以直接输出比较结果。 7.1.1 界面说明
【Dependent List框】
用于选入需要分析的变量。 【Independent List框】 用于选入分组变量。 【Options钮】
弹出Options对话框,选择需要计算的描述统计量和统计分析:
o Statistics框 可选的描述统计量。它们是: 1. sum,number of cases 总和,记录数
2. mean, geometric mean, harmonic mean 均数,几何均数,修正均数
3. standard deviation,variance,standard error of the mean 标准差,均数的标准误, 方
差
4. median, grouped median 中位数,频数表资料中位数(比如30岁组有5人,40岁组
有6人,则在计算grouped median时均按组中值35和45进行计算)。 5. minimum,maximum,range 最小值,最大值,全距
6. kurtosis, standard error of kurtosis 峰度系数,峰度系数的标准误 7. skewness, standard error of skewness 偏度系数,偏度系数的标准误
8. percentage of total sum, percentage of total N 总和的百分比,样本例数的百分比 o Cell Statistics框 选入的描述统计量。 o Statistics for First layer复选框组
1. Anova table and eta 对分组变量进行单因素方差分析,并计算用于度量变量相关程度
的eta值。
2. Test for linearity 检验线性相关性,实际上就是上面的单因素方差分析。 7.1.2 结果解释
以第一章的数据为例,输出如下: Means
上表还是缺失值报告。
常用统计描述量报表。这里按默认情况输出均数,样本量和标准差。由于我们选择了分组变量,因此三项指标均给出分组及合计值,可见以这种方式列出统计量可以非常直观的进行各组间的比较。
上表为单因素方差分析表。在选择了Anova table and eta或Test for linearity复选框时出现。实际上就是在检验各组间均数有无差异。上面各项的具体含义将在单因素方差分析一节中解释。
相关性度量指标,给出Eta值以及Eta值的平方根。 §7.2 One-Samples T Test过程
One-Samples T Test过程用于进行样本所在总体均数与已知总体均数的比较,可以自行定义已知总体均数为任意值,该对话框的界面非常简单。
One-Samples T Test过程的输出也是比较简单的,由描述统计表和t检验表组成,比如要检验数据li1_1.sav中血磷值的总体均数是否等于1,则输出如下: T-Test
所分析变量的基本情况描述,有样本量、均数、标准差和标准误。
上表为单样本t检验表,第一行注明了用于比较的已知总体均数为1,下面从左到右依次为t值(t)、自由度(df)、P值(Sig.2-tailed)、两均数的差值(Mean Difference)、差值的95%可信区间。由上表可知:t=2.975,P=0.007。因此可以认为血磷值的总体均数不等于1。 §7.3 Independent-Samples T Test过程
Independent-Samples T Test过程用于进行两样本均数的比较。 7.3.1 界面说明 【Test Variables框】
用于选入需要分析的变量。 【Grouping Variable框】
用于选入分组变量。注意选入变量后还要定义需比较的组别。 【Define Groups框】
用于定义需要相互比较的两组的分组变量值。
可以这样来理解:如果分组变量有3个取值(即有三组),而我们做t检验是比较其中的某两组,这时就可以用Define Groups框来指定需比较的两组。当然,如果分组变量只有2个取值时,我们仍然要再该框中进行定义,这也算是SPSS对话框存在的一个小缺陷吧。 【Options钮】
和One-Samples T Test对话框的Options钮完全相同,此处不再重复。 7.3.2 结果解释
比如要检验数据li1_1.sav中克山病患者与健康人的血磷值是否相同,用Independent-Samples
T Test过程的结果输出如下: T-Test
两组需检验变量的基本情况描述。
可见该结果分为两大部分:
第一部分为Levene's方差齐性检验,用于判断两总体方差是否齐,这里的戒严结果为F = 0.032,P = 0.860,可见在本例中方差是齐的;
第二部分则分别给出两组所在总体方差齐和方差不齐时的t检验结果,由于前面的方差齐性检验结果为方差齐,第二部分就应选用方差齐时的t检验结果,即上面一行列出的t= 2.524,ν=22,P=0.019。从而最终的统计结论为按α=0.05水准,拒绝H0,认为克山病患者与健康人的血磷值不同,从样本均数来看,可认为克山病患者的血磷值较高。最后面还附有一些其他指标,如两组均数的可信区间等,以对差异情况有更直观的了解。 §7.4 Paired-Samples T Test过程
该过程用于进行配对设计的差值均数与总体均数0比较的t检验,他的功能实际上是和One-Samples T Test过程相重复的(等价于已知总体均数为0的情况),但Paired-Samples T Test过程使用的数据输入格式和前者不同,即我们所称的统计表格格式,因此仍然有存在的价值。
7.4.1 界面说明
整个界面上只有一个Paired Variable框需要介绍,他用于选入希望进行比较的一对或几对变量--注意这里的量词是对而不是个。选入变量需要成对成对的选入,即按住Ctrl键,选中两个成对变量,再单击
将其选入。如果只选中一个变量,则
按钮为灰色,不可
用。
7.4.2 分析实例
例7.1 某单位研究饮食中缺乏维生素E与肝中维生素A含量的关系,将同种属的大白按性别相同,年龄、体重相近者配成对子,共8对,并将每对中的两头动物随机分到正常饲料组和维生素E缺乏组,过一定时期将大白鼠杀死,测得其肝中维生素A的含量,问不同饲料的大白鼠肝中维生素A含量有无差别?
大白鼠对号 正常饲料组 维生素E缺乏 1 2 3
3550 2000 3000
2450 2400 1800
4 5 6 7 8
3950 3800 3750 3450 3050
3200 3250 2700 2500 1750
解:为了说明问题,此处假设输入数据时就按照上表格式输入,其中正常饲料组变量名为G1,维生素E缺乏组变量名为G2。操作如下:
1. 同时选中G1、G2:选入Paired Variables框 2. 单击OK钮 7.4.3 结果解释
以例7.1为例,其输出结果如下: T-Test
配对变量各自的统计描述,此处只有1对,故只有Pair 1。
此处进行配对变量间的相关性分析。等价于Analyze==>Correlate==>Bivariate。
配对t检验表,给出最终的检验结果,由上表可见P=0.004,故可认为两种饲料所得肝中维生素A含量有差别,即维生素E缺乏对大白鼠肝中维生素A含量有影响。 上表的标题内容翻译如下: §7.5 One-Way ANOVA过程
One-Way ANOVA过程用于进行两组及多组样本均数的比较,即成组设计的方差分析。 7.5.1 界面说明
【Dependent List框】
选入需要分析的变量,可选入多个结果变量(应变量)。 【Factor框】
选入需要比较的分组因素,只能选入一个。 【Contrast钮】
弹出Contrast对话框,用于对精细趋势检验和精确两两比较的选项进行定义,由于该对话框太专业,也较少用,这里只做简单介绍。
o Polynomial复选框 定义是否在方差分析中进行趋势检验。