下面重点介绍一下各部分的功能如下:
【Display frequency tables复选框】:确定是否在结果中输出频数表。
【Statistics钮】:单击后弹出Statistics对话框如图1.2,用于定义需要计算的其他描述统计量。
图1.2频数分布表分析过程Statistics对话框
现将各部分解释如下:
(1) Percentile Values复选框组:定义需要输出的百分位数,可计算四分位数
(Quartiles)、每隔指定百分位输出当前百分位数(Cut points for equal groups)、或直接指定某个百分位数(Percentiles),如直接指定输出P2.5和P97.5。
(2)
Central tendency复选框组:用于定义描述集中趋势的一组指标:均数(Mean)、
中位数(Median)、众数(Mode)、总和(Sum)。
(3)
Dispersion复选框组:用于定义描述离散趋势的一组指标:标准差
(Std.deviation)、方差(Variance)、全距 (Range)、最小值(Minimum)、最大值(Maximum)、标准误(S.E.mean)。
(4)
Distribution复选框组:用于定义描述分布特征的两个指标:偏度系数
(Skewness)和峰度系数(Kurtosis)。
(5)
Values are group midpoints复选框:当你输出的数据是分组频数数据,并且
具体数值是组中值时,选中该复选框以通知SPSS,免得它犯错误。
【Charts钮】:弹出Charts对话框,用于设定所做的统计图。
(1)Chart type单选钮组:定义统计图类型,有四种选择:无、条图(Bar chart)、圆图(Pie chart)、直方图Histogram),其中直方图还可以选择是否加上正态曲线(With normal curve)。
(2)Chart Values单选钮组:定义是按照频数还是按百分比做图(即影响纵坐标刻度)。 【Format钮】:弹出Format对话框,用于定义输出频数表的格式,不过用处不大,一般不管。
(1)Order by单选钮组:定义频数表的排列次序,有四个选项:Ascending values为根据数值大小按升序从小到大作频数分布;Descending values为根据数值大小按降序从大到小作频数分布;Ascending counts为根据频数多少按升序从少到多作频数分布;Descending counts为根据频数多少按降序从多到少作频数分布。
(2)Multiple Variables单选钮组:如果选择了两个以上变量做频数表,则Compare variables可以将他们的结果在同一个频数表过程输出结果中显示,便于互相比较,Organize output by variables则将结果在不同的频数表过程输出结果中显示。
(3)Suppress Tables more than...复选框: 当频数表的分组数大于下面设定数值时禁止它在结果中输出,这样可以避免产生巨型表格。
1.1.2.分析实例
例: 某地101例健康男子血清总胆固醇值测定结果如下,请绘制频数表、直方图,计算均数、标准差、变异系数CV、中位数M、p2.5和p97.5。
4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 4.12 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.86 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 3.05
解:为节省篇幅,这里只给出精确频数表的做法,假设数据已经输好,变量名为X,具体解法如下:
1. Analyze==>Descriptive Statistics==>Frequencies 2. Variables框:选入X 3. 单击Statistics钮:
4. 选中Mean、Std.deviation、Median复选框
5. 单击Percentiles:输入2.5:单击Add:输入97.5:单击Add: 6. 单击Continue钮 7. 单击Charts钮: 8. 选中Bar charts 9. 单击Continue钮 10. 单击OK
得出结果后手工计算出CV。 1.1.3.结果解释
上例除直方图外的输出结果如表1.1和表1.2:
表1.1 统计特征值描述
最上方为表格名称,左上方为分析变量名,可见样本量N为101例,缺失值0例,均数Mean=4.69,中位数Median=4.61,标准差STD=0.8616,P2.5=3.04,P97.5=6.45。
表1.2频数分布表
系统对变量x作频数分布表(此处只列出了开头部分),Vaild右侧为原始值,Frequency为频数,Percent为各组频数占总例数的百分比(包括缺失记录在内),Valid percent为各组频数占总例数的有效百分比,Cum Percent为各组频数占总例数的累积百分比。
1.2.统计描述分析过程(Descriptives)
Descriptives过程是连续资料统计描述应用最多的一个过程,他可对变量进行描述性统计分析,计算并列出一系列相应的统计指标。这和其他过程相比并无不同。但该过程还有个特殊功能就是可将原始数据转换成标准正态评分值并以变量的形式存入数据库供以后分析。
1.2.1.界面说明
从SPSS的“Analyze”->“Descriptive Statistics”->“Descriptives”,进入统计描述分析过程的主对话框,如图1.3。
图1.3 统计描述分析过程的主对话框
【Save standardized values as variables复选框】:确定是否将原始数据的标准正态评分存为新变量。
【Options钮】:弹出Options对话框,大部分内容均在前面Frequences过程的Statistics对话框中见过,只有最下方的Display Order单选钮组是新的,可以选择为变量列表顺序、字母顺序、均数升序或均数降序。
1.2.2.结果解释
表1.3是一个典型的Descriptives过程结果统计表,一望可知,这里的大部分内容都在上一节见过,结果报告了X变量的样本数N、最小值、最大值、均值和标准差。
表1.3 Descriptives过程结果统计表
二、均值分析与T检验
T检验是检验差异性显著性的十分重要的统计工具,这种差异显著性的检验是样本均值间的比较,因此T检验也可以称为一种均值比较分析。具体包括:单样本T检验、独立样本T检验、配对样本T检验。下面仍然以SPSS为例介绍上述各种均值检验的实现过程。
2.1.独立样本T检验(One-Samples T Test)过程
One-Samples T Test过程用于进行样本所在总体均数与已知总体均数的比较,可以自行定义已知总体均数为任意值,该对话框的界面非常简单。