对应分析spss例析
在现实研究中,研究人员很多情况下所关心的除行和列本身变量之间关系外,更想了解行列变量之间的相互关系;将R和Q型分析合二为一;对应分析应运而生。
对应分析(Correspondence analysis)也称关联分析、R-Q型因子分析,是近年新发展起来的一种多元相依变量统计分析技术,通过分析由定性变量构成的交互汇总表来揭示变量间的联系。可以揭示同一变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系。
主要应用在市场细分、产品定位、地质研究以及计算机工程等领域中。原因在于,它是一种视觉化的数据分析方法,它能够将几组看不出任何联系的数据,通过视觉上可以接受的定位图展现出来。
对应分析的基本思想是将一个联列表的行和列中各元素的比例结构以点的形式在较低维的空间中表示出来。
它最大特点是能把众多的样品和众多的变量同时作到同一张图解上,将样品的大类及其属性在图上直观而又明了地表示出来,具有直观性。另外,它还省去了因子选择和因子轴旋转等复杂的数学运算及中间过程,可以从因子载荷图上对样品进行直观的分类,而且能够指示分类的主要参数(主因子)以及分类的依据,是一种直观、简单、方便的多元统计方法。
对应分析法整个处理过程由两部分组成:表格和关联图。对应分析法中的表格是一个二维的表格,由行和列组成。每一行代表事物的一个属性,依次排开。列则代表不同的事物本身,它由样本集合构成,排列顺序并没有特别的要求。在关联图上,各个样本都浓缩为一个点集合,而样本的属性变量在图上同样也是以点集合的形式显示出来。
例:在对218名受访人员进行收入水平和品牌选择关系的调查研究中,得到如下调查数据,对其进行对应分析。
SPSS需要的数据格式如下
DATA ----?weight cases
Analyze----?data reduction--?correspondence analysis
Model对话框中
Dimensions in solution 2,解的维度;即将样本和指标在二维空间中对应的进行分类。
Distance measure:距离测度上采用默认的Chi square,标准对应分析要求使用此测度。
Standardization method正规化方法选择上,由于上面选择的是卡方距离,所以这里只能用row and column means are removed(即同时对行和列进行中心化处理)
Statistic 对话框中
Correspondence table现实原始数据,还包括行列的边际和及总和;可以用来核对输入的数据的准确性。 Overview of row/column points:此项必须选择,行列变量在各个维度上的分量。
Plot 对话框:
Bioplot双维图法,输出行列变量坐标的二维图。下面两个选项是本图的分列。
Correspondence Table 收入水平 品牌 A B C D E F Active Margin 低 2 49 4 4 15 1 75 中 7 7 5 49 2 7 77 高 Active Margin 16 3 23 5 5 14 66 25 59 32 58 22 22 218 核对输入数据的正确性 Row Profiles 收入水平 品牌 A B C D E F Mass 低 .080 .831 .125 .069 .682 .045 .344 中 .280 .119 .156 .845 .091 .318 .353 高 Active Margin .640 .051 .719 .086 .227 .636 .303 1.000 1.000 1.000 1.000 1.000 1.000 行归一化处理表:行和为分母进行归一化处理的结果,mass为列的边际概率,即各列和占总和比例。
Summary Proportion of Inertia Dimension 1 2 Total Singular Value .729 .586 Inertia .531 .343 .874 190.534 Chi Square Sig. Accounted for .608 .392 .000a 1.000 Cumulative .608 1.000 1.000 Confidence Singular Value Standard Deviation .047 .058 Correlation 2 .165 a. 10 degrees of freedom