北航数理统计聚类分析大作业(3)

2019-07-31 09:36

用逐步分析方法选择用于构造判别函数的变量。

表7 分析中的变量

表8特征值

Eigenvalues代表用于分析的前两个典则判别函数的特征值, 是组间平方和与组内平方和之比值。最大特征值与组均值最大的向量对应, 第二大特征值对应着次大的组均值向量。

表9标准化的典则判别式函数系数

标准化的典则判别式函数系数(使用时必须用标准化的自变量)。由图可知Fisher判别法构造的两个典则判别函数为：

Y1=1.275X1+1.824X2-1.654X3 Y2=-0.639X1-0.815X2-0.065X3

表10 分类结果

从表10分类结果中可以看出初始分组的正确率。

表11 详细分类结果

从图中我们可以看出，有山东这个观测量被错误地分到了第1类上，而预测结果应是第二类，对出现这种现象较合理的解释是山东

2007年经济的快速发展使其经济状况改善的原因。

上图为观测量分类点图，从图中我们可以清楚地看到观测量的分类情况，可见三个类型的中心点距离较远，区分效果较好。

3 总结

本文以SPSS 16.0为分析工具，通过地区生产总值对各地经济发展进行了聚类分析和判别分析，对我国各地区的经济发展情况和贫富分布有了初步的了解。

总体来说，我国经济发展东强西弱的结果没有改变。我国东部沿海各省份的经济发展明显强于中西部地区；中部及东北地区地区经济地位近年来不上不下；而位于我国西部偏远地区的青海、西藏等省份，在我国经济发展格局中明显处于不利地位。

当然，我们也应该欣喜地看到，国家西部大开发战略和中部崛起战略的实施必然会对中西部地区经济的发展起着巨大的促进作用。

总之，采用聚类和判别分析分析地区经济发展状况所得的模型符合我国当前实际情况，其结果具有统计学和现实意义，因此有比较实际的应用和研究价值。

通过本次大作业能够理解掌握聚类分析和判别分析的相关概念，学会了用统计软件SPSS进行简单案例的求解分析。对以后的研究生阶段处理相关问题打下基础。

最后，感谢孙海燕老师一学期以来对我们的悉心教导。

参考文献

[1] 孙海燕, 周梦, 李卫国, 冯伟, 应用数理统计, 北京航空航天大学, 2013.9

[2] 余建英, 何旭宏. 数据统计分析与 SPSS 应用[M]. 人民邮电出版社, 2003.

北航数理统计聚类分析大作业(3).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！