第七章 列联表 分析
7.1 列联表(Crosstabs)分析的过程 7.2 列联表的实例分析
7.1 列联表 (Crosstabs) 分析的过程
列联表分析的过程是对两个变量之间关系的分析方法。被分析的变量可以是定类变量也可以是定序变量。系统是通过生成列联表对两个变量进行列联表分析的。 列联表分析的功能可以通过下述操作来实现。
图7-1 列联表分析对话框
1.打开列联表分析对话框 执行下述操作:
Analyze→Descriptive→Crosstabs 打开Crosstabs 对话框如图7-1 所示。 2.确定列联分析的变量
从左侧的源变量窗口中选择两个定类变量或定序变量分别进入Row(s)(行)窗口和Column(s)(列)窗口。进入Row(s)窗口的变量的取值将作为行的标志输出,而进入Column(s)窗口的变量的取值将作为列的标志输出。Display clustered bar charts 是在输出结果中显示聚类条图。Suppress table 是隐藏表格,如果选择此项,将不输出R×C 列联表。 3.选择统计分析内容
单击statistics 按钮,打开statistics 对话框,如图7-2 所示。
图7-2statistics 对话框
下面介绍该对话框中的选项和选项栏的内容:
(1)Chi-square 是卡方(X2)值选项,用以检验行变量和列变量之间是否独立。适用于定类变量和定序变量。
(2)Correlations 是皮尔逊(Pearson)相关系数r 的选项。用以测量变量之间的线性相关。适用于定序或数值变量(定距以上变量)。 (3)Nominal 是定类变量选项栏。选项栏中的各项是当分析的两个变量都为定类变量时可以选择的参数。
1)Contingency coefficient:列联相关的C 系数,由卡方系数修正而得。 2) Phi and Cramer's V:列联相关的V 系数,由卡方系数修正而得。 3)Lambda:λ系数。
4)Uncertainty Coefficient:不定系数。 (4)Ordinal 是定序变量选项栏。选项栏中的各项是当分析的两个变量都为定序变量时可以选择的参数。
1)Gramma:Gramma 等级相关系数。
2)Somers’d:Somers 等级相关d 系数。
3)Kendall’s tau-b:肯得尔等级相关tau-b 系数。 4)Kendall’s tau-c:肯得尔等级相关tau-c 系数。
(5)Nominal by Interval 选项栏中的Eta 是当一个变量为定类变量,另一个变量为数值变量时,测量两个变量之间关系的相关比率。 系统默认状态是不输出上述参数。如需要可自行选择。上述选择做完以后,单击Continue 返回到Crosstabs 对话框。
4.确定列联表内单元格值的选项
单击Cells(单元格)按钮,打开Cell Display 对话框,如图7-3 所示。
图7-3 Cell Display 对话框
(1)Counts 是单元格的频次选项栏。 1)Observed:观测值的频次。 2)Expected:期望频次。
系统默认状态是输出观测值的频次。
(2)Percentages 是确定输出百分比的选项栏。该选项栏中的选项用于确定在输出文件中的列联表单元格中是否要输出百分比。
1)Row:单元格中个案的数目占行总数的百分比。 2)Column:单元格中个案的数目占列总数的百分比。 3)Total:单元格中个案的数目占个案总数的百分比。 (3)Residuals 是确定残差的选项栏。 1)Unstandardized:非标准化残差。 2)Standardized: 标准化残差
3) Adj. Standardized:调整的标准化残差
上述选择做完以后,单击Continue 按钮,返回到Crosstabs 对话框。 5.确定列联表的行顺序
单击Format(格式)按钮,打开Format 对话框,如图7-4 所示。在该对话框中可以选择在输出的列联表中行的排列是升序还是降序。系统默认是升序。选择做完以后,单击Continue 按钮,返回到Crosstabs 对话框。
图7-4Format 对话框
6.单击OK 按钮,提交运行。即可在输出文件的Output 窗口中输出列联表。
7.2 列联表的实例分析
实例:对“休闲调查1”中的“性别”和“对闲暇生活的满意度 — 夫妻共度闲暇时间状况”进行列联表分析,并进行卡方检验。
打开数据文件“休闲调查1”后,执行下述操作:
1.Analyze→Descriptive→Crosstabs 打开Crosstabs 对话框。
2.从左侧的源变量窗口中选择“性别” 变量进入到Row(s)窗口中,选择“对闲暇生活的满意度 — 夫妻共度闲暇时间状况”变量进入到Column(s) 窗口中。
3.单击Statistics 按钮,打开statistics 对话框。选择Chi-square 选项。单击Continue返回到Crosstabs 对话框。
4.单击Cell 按钮,打开Cell Display 对话框。选择Row 选项。单击Continue 返回到Crosstabs 对话框。
5.单击OK 按钮,提交运行。系统打开Output 窗口并输出如表7-1、表7-2、和表7-3的统计分析结果。 表7-1 统计概要
Case Processing Summary
Valid N 的满意度 — 夫妻 共度闲暇时间状况 Cases Missing N .0% Total Percent 283 100.0% Percent N Percent 性别 * 对闲暇生活 283 100.0% 0 表7-1的统计概要说明:有效数据为283个,系统缺失值为0个。
表7-2 列联表
性别* 对闲暇生活的满意度 — 夫妻共度闲暇时间状况 Crosstabulation 性别 男 Count % within 性别 % within 性别 Total Count % within 性别
女 Count 对闲暇生活的满意度 — 夫妻共度闲暇时间状况 很不满意 不大满意 基本满意 很满意 2 1.4% 5 3.6% 7 2.5% 19 13.3% 25 17.9% 44 15.5% 72 50.3% 68 48.6% 140 49.5% 33 23.1% 14 10.0% 47 17.6% 不好说 17 11.9% 28 20.0% 45 15.9% 143 100.0% 140 100.0% 283 100.0% Total 表7-3 卡方检验表
Chi-Square Tests Pearson Chi-Square Likelihood Ratio N of Valid Cases Value 12.558a 12.853 283 df 4 4 Asymp. Sig.(2-sided) .014 .012 a.2 cells (20.0%) have expected count less than 5. Theminimum expected count is 3.47.
在卡方检验表中中各项的内容分别为: ◆Pearson Chi-Square:皮尔逊卡方值
◆Likelihood Ratio:似然比卡方(初学者可不必了解)。 ◆N of Valid Cases:有效Cases 数
◆Asymp. Sig. (2-sided):双尾的非对称的显著性检验。
卡方检验表下面的说明是:有2 个格值(占总格值数的20%)的期望频次小于5。卡方检验要求期望频次小于5 的格值数不应超过25%,本实例的检验满足要求,卡方检验的结果是有效的。
卡方检验的结果表明,皮尔逊卡方值为检验的显著性水平已达到0.014,小于0.05,说明男女两性对夫妻共度闲暇时间状况的满意度有显著差异。结合表7-2 中的行百分比可以看出女性的满意度低于男性,而不满意度则高于男性。说明女性更渴望夫妻共同度过闲暇时间。
第八章 多选变量分析
8.1 用多选变量生成新变量
8.1.1 用多选变量生成新变量的过程 8.1.2 用多选变量生成新变量的实例 8.2 多选变量的频次分析
8.2.1 对多选变量进行频数分析的过程 8.2.2 对多选变量进行频数分析的实例 8.3 多选变量的列联分析
8.3.1 对新变量进行列联分析的过程 8.3.2 对新变量进行列联分析的实例
多选变量是指对于包含了多个答案的一个问题,可以允许被调查者在其中作多项选择。 多项选择题可以在SPSS 中做成多个内容相同的变量。对于多选变量进行分析时 ,我们不仅希望知道某些选项在第一选、第二选或第三选中分别被多少人选择过(通过frequency 解决),我们还希望知道某些选项在多次选择中总共被选择了多少次,这个问题要通过多选变量分析来解决。现以“休闲调查1”中的“娱乐活动目的”一题的回答结果为例,来阐述多选变量的分析过程。由于娱乐活动目的是多方面的,因此允许被调查者在给出的六个答案中做三项选择。每一项选择都在SPSS 的数据文件中做成一个变量,即做成了三个相同内容的变量。对这三个变量的分析就是多选变量的分析。但要注意,一定要把这些变量设置成为数值型变量,否则无法进行多选变量的分析。多选变量分析的基本过程分为两步来进行。第一步是用三个多选变量生成一个新变量。第二步是对新生成的变量进行分析。
8.1 用多选变量生成新变量
8.1.1 用多选变量生成新变量的过程 1.选择要分析的多选变量 执行下述操作:
Analyze→Multiple Response(多选变量)拉出二级菜单,如图8-1 所示。