04单击【确定】(OK)按钮,即可在结果输出窗口中得到描述性统计分析结果输出表格。 3.3 频数分析
对于一组数据,考察不同的数值出现的频数,或者是数据落入指定区域内的频数,可以了解数据的分布状况。从SPSS15.0开始就提供了“频数分析”这一功能。通过频数分析,用户在得到描述性统计结果的同时,还能了解变量取值的分布情况,从而使总体数据的分布通过频数分析得到更为清晰、准确的输出。 频数分析的具体操作步骤如下:
01打开数据文件,选择【分析】(Analyze)菜单,单击【描述统计】(Descriptive Statistics)命令下的【频率】(Frequencies)命令。SPSS将弹出“频率”(Frequencies)主对话框,如图3-5所示。
图3-5 “频率”(Frequencies)主对话框 在该主对话框中,同样可以通过单击
按钮从左边的原变量中选择一个或者几
个变量进入右边的“变量”(Variable(s))列表框中。
对话框底部有一项“显示频率表格”(Display frequency tables)复选框,SPSS默认选择此项。选择此项后,输出结果将显示频数分布表,否则只显示直方图,不显示频数分布表。
“频率”主对话框的右方有3个按钮,从上到下依次为【统计量】(Statistics)按钮、【图表】(Charts)按钮和【格式】(Format)按钮。单击可进入对应对话框。
02单击【统计量】按钮,打开“频率:统计量”(Frequencies:Statistics)对话框,如图3-6所示。
图3-6 “频率:统计量”对话框
在该对话框中,用户可以选择所要统计的统计量。对话框中各选项的具体意义如下:
(1)百分位值(Percentile Values)栏为复选项,在此栏中可选择多项。
l 四分位数(Quartile)
l 割点(Cut points):选择此项,在后面的文本框中输入数值,假设
为N(N为在2~100之间的整数),则计算并显示N分位数。 l 百分位数(Percentile(s)):选择此项,在后面的文本框中输入数
值,可以有选择地显示百分位数。在文本框中可以输入0到100之间的数,输入后,单击【添加】(Add)按钮,将对应的百分位数添加到方框内的列表框中,利用【更改】(Change)按钮和【删除】(Remove)按钮,可以对列表框中的选项进行修改和删除。
(2)离散(Dispersion)栏(复选项):
标准差(Std Deviation) 最小值(Minimum) 方差(Variance) 最大值(Maximum) 范围(极差)(Range) 均值的标准误(S.E. Mean) (3)集中趋势(Central Tendency)栏(复选项):
均值(Mean)、中位数(Median)、众数(Mode)、合计(Sum)。
“集中趋势”栏下方有一个“值为组的中点”(Values are group midpoints)复选框,如果假设数据已经分组,而且数据取值为初始分组的中点,选择此项,将计算百分位数统计和数据的中位数。 (4)分布栏(Distribution)(复选项): 峰度(Kurtosis)、偏度(Skewness)。
用户在“频率:统计量”对话框中单击选中所要统计的统计量后,单击【继续】(Continue)按钮,即可返回主对话框。
03单击【图表】(Charts)按钮,打开“频率:图表”(Frequencies:Charts)对话框,如图3-7所示。
在该对话框中,用户可以选择频数分析的图表类型。该对话框中各选项的具体意义如下:
(1)图表类型(Chart Type)(单选项):无(None)(系统默认选项)、条形图(Bar charts)、饼形图(Pie charts)、直方图(Histograms)。
图3-7 “频率:图表”对话框
(2)图表值(Chart Values)(单选项组):可选择图形中分类值的表现形式。
l 频率(Frequencies):如果图表类型是直方图,则直方图的纵轴为
频数;如果图表类型是饼形图,则饼形图中每块表示属于该组观测值的频数。
l 百分比(Percentage):如果图表类型是直方图,则直方图的纵轴为
百分比;如果图表类型是饼形图,则饼形图中每块表示该组的观测量数占总数的百分比。
l 用户在“频率:图表”对话框中选择图表类型和图表分类值后,单击
【继续】(Continue)按钮,即可返回主对话框。
04单击【格式】(Format)按钮,打开“频率:格式”(Frequencies:Format)对话框,如图3-8所示。
图3-8 “频率:格式”对话框
在该对话框中,用户可以设置频率分布表的输出格式。对话框中各选项的意义如下:
(1)排序方式(Order by)栏:单选项组,用户可以选择频数分布表中数值及其对应频率的排列顺序。
l 按值的升序排序(Ascending values):系统默认选项,频数分布表
中将按照数值从小到大排列。
l 按值的降序排序(Descending values):频数分布表中将按照数值
从大到小排列。
l 按计数的升序排序(Ascending counts):频数分布表中将按照计数
从小到大排列。
l 按计数的降序排序(Descending counts):频数分布表中将按照计
数从大到小排列。
如果用户在“频率:图表”对话框中选择输出直方图,频数分布表将按照数值顺序排列。
(2)多个变量(Multiple Variables)栏:单选项组,当“频率(Frequencies)”主对话框的“变量”(Variable(s))列表框中有多个变量时,利用“多个变量”栏可以设置表格的显示方式。
l 比较变量(Compare variables):系统默认选项,SPSS将所有变量
的描述统计的结果显示在同一张表格中,方便用户进行比较分析。 按变量组织输出(Organize output by variable):SPSS将对应每个变量分别输出单独的描述统计表格。
用户在“频率:格式”对话框中进行选择后,单击【继续】(Continue)按钮,即可返回“频率”主对话框。一般情况下,对“频率:格式”对话框的选项都默认为系统默认值,不作调整。
05单击【确定】(OK)按钮,即可在结果输出窗口中得到频数分布表、描述性统计分析输出表格和用户选择的对应的输出图形。 3.4 探索分析
探索分析是在对数据的基本特征统计量有初步了解的基础上,对数据进行的更为深入详细的描述性观察分析。它在一般描述性统计指标的基础上,增加了有关数据其他特征的文字与图形描述,显得更加细致与全面,有助于用户思考对数据进行进一步分析的方案。主要的分析如下:
(1)观察数据的分布特征:通过绘制箱锁图和茎叶图等图形,直观地反映数据的分布形式和数据的一些规律,包括考察数据中是否存在异常值等。过大或过小的数据均有可能是奇异值、影响点或错误数据。寻找异常值,并分析原因,