SPPS使用指南(5)

2018-12-11 22:56

Distances过程是专门进行距离相关分析用的，由于该方法大多数人用的非常少，里面又涉及到太深的统计原理，这里我只对界面做一解释，就不再深入下去了。如要用到，请参考有关的多元统计专业书。

从SPSS的“Analyze”->“Correlate”-> “Distances”,进入距离分析的主对话框，如下图3.3所示。

图3.3距离分析的主对话框

【Variables框】：用于选入需要进行距离相关分析的变量，至少需要选入两个。【Label cases by框】：选择一个变量用于给各个记录加上标签，可以不选。【Compute Distances单选框组】：其中有两个选择，Between cases表示作变量内部观察值之间的距离相关分析，Between variables表示作变量之间的距离相关分析。

【Measure单选框组】：用于选择分析时采用的距离类型：Dissimilarities为不相似性测距，Similarities为相似性测距。

【Measure钮】：和前面的Measure单选框组配合使用，单击后弹出Distance：Dissimilarity Measure对话框，用户可根据数据特征选用测距方法：

1、选择Dissimilarities时各种数据类型可用的测距方法有：（1）计量资料

? Euclidean distance：以两变量差值平方和的平方根为距离； ? Squared Euclidean distance：以两变量差值平方和为距离； ? Chebychev：以两变量绝对差值的最大值为距离；

? Block：以两变量绝对差值之和为距离；

? Minkowski：以两变量绝对差值p次幂之和的p次根为距离； ? Customized：以两变量绝对差值p次幂之和的r次根为距离。

（2）计数资料

? Chi-square measure：χ2值测距；

? Phi-square measure：ψ2值测距，即将χ2测距值除合计频数的平方根。

（3）二分类变量

? Euclidean distance：二分差平方和的平方根，最小为0，最大无限； ? Squared Euclidean distance：二分差平方和，最小为0，最大无限； ? Size difference：最小距离为0，最大无限； ? Pattern difference：从0至1的无级测距； ? Variance：以方差为距，最小为0，最大无限；

? Lance and Williams：Bray-Curtis非等距系数，界于0至1之间。

2、选择Similarities时各种数据类型可用的测距方法有：（1）计量资料

? Pearson correlation：以Pearson相关系数为距离； ? Cosine：以变量矢量的余弦值为距离，界于-1至+1之间。

（2）二分类变量

? Russell and Rao：以二分点乘积为配对系数；

? Simple matching：以配对数与总对数的比例为配对系数；

? Jaccard：相似比例，分子与分母中的配对数与非配对数给予相同的权重； ? Dice：Dice配对系数，分子与分母中的配对数给予加倍的权重；

? Rogers and Tanimoto：Rogers and Tanimoto配对系数，分母为配对数，分子为非

配对数，非配对数给予加倍的权重；

? Sokal and Sneath 1：Sokal and Sneath Ⅰ型配对系数，分母为配对数，分子为非

配对数，配对数给予加倍的权重；

? Sokal and Sneath 2：Sokal and Sneath Ⅱ型配对系数，分子与分母均为非配对数，

但分子给予加倍的权重；

? Sokal and Sneath 3：Sokal and Sneath Ⅲ型配对系数，分母为配对数，分子为非

配对数，分子与分母的权重相同；

? Kulczynski 1：Kulczynski Ⅰ型配对系数，分母为总数与配对数之差，分子为非配

对数，分子与分母的权重相同；

? Kulczynski 2：Kulczynski平均条件概率；

? Sokal and Sneath 4：Sokal and Sneath 条件概率； ? Hamann：Hamann概率；

? Lambda：Goodman-Kruskai相似测量的λ值；

? Anderberg's D：以一个变量状态预测另一个变量状态； ? Yule's Y：Yule综合系数，属于2×2四格表的列联比例函数； ? Yule's Q：Goodman-Kruskal γ值，属于2×2四格表的列联比例函数。

（3）其他类型变量

? Ochiai：Ochiai二分余弦测量；

? Sokal and Sneath 5：Sokal and Sneath Ⅴ型相似测量； ? Phi 4 point correlation：Pearson相关系数的平方值； ? Dispersion：Dispersion相似测量。 ? 同时，还可以选择数据转换形式： ? None：不作数据转换； ? Z-Scores：作标准Z分值转换；

? Range -1 to 1：作-1至+1之间的标准化转换； ? Range 0 to 1：作0至1之间的标准化转换； ? Maximum magnitude of 1：作最大量值1的标准转换； ? Mean of 1：作均数单位转换；

? Standard deviation of 1：作标准差单位转换

四、回归分析

4.1．一元线性回归分析 4.1.1．线性回归分析概念

在数量分析中，我们经常会看到变量与变量之间存在着一定的联系，而不只是前面所讨论的单个变量的某些孤立的特性，如均值、方差的特性等。我们要了解的是变量之间是如何

发生相互影响的，这就是所谓回归分析。

为了具体说明，考虑家庭月可支配收入如何影响消费支出。如果把不同的可支配收入X （千元）对应的消费支出Y（千元）画在平面图上，那么可以得到如下的散点图4.1。

图4.1 家庭可支配收入与消费支出之间的散点图

从该图4.1似乎可以看到可支配收入确实对消费支出有影响。也应该可能通过拟合一条穿过这一散点图的直线或曲线来描述可支配收入X 是如何影响消费支出Y 的。这里的消费支出Y 取决于可支配收入，作为因变量（或被解释变量、响应变量），可支配收入X 不依赖于消费，作为自变量（或解释变量、独立变量、预测因子、回归子等）。

4.1.2．一元线性回归分析实现

下面以SPSS 为例介绍一元线性回归方程估计的实现过程。在SPSS中进行一元线性回归方程估计的操作步骤为：

（1）建立数据文件，定义“消费支出”变量为Y，定义“可支配收入”变量为X，并录入;

（2）选择主菜单[Analyze]=>[Regression]=>[Linear]，打开[Linear Regression]主对话框，见图4.2。在左边列表框中选定变量Y，单击按钮，使之进入[Dependent]框，选定变量X，单击按钮使之进入[Independent(s)]框。

图4.2线性回归主对话框

（3）单击[OK]按钮，得到如下结果见表4.1。

输出结果中的[Unstandardized Coefficients]指未标准化的系数估计值（B）及其标准误（Std.Error）。可以看出，系数估计值分别为b0=0.607,b1 =0.542. b1 对应的T检验统计量的值为12.832，P值为0.00，拒绝可支配收入对消费支出没有影响的零假设，即认为可支配收入对消费支出有着显著的影响。F 检验是对回归总体线性关系是否显著的一种假设检验。本例中F值为164.655，对应的P值为0.00，结果拒绝回归总体线性关系不显著的零假设，即认为回归总体线性关系显著。

表4.1 线性回归分析结果

共8页:

SPPS使用指南(5).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档