Spss16.0与统计数据分析(8)

2019-05-26 20:07

故而得到表中的数据变化如下:

输出结果分析:

下表表示的是初始聚类中心,也就是种子点 Initial Cluster Centers 农业 工业 建筑业 交通运输仓储蓄和邮政业 批发分零售业 住宿和餐饮业 金融业 1 74.47 48.18 160.61 23.95 34.25 17.75 31.70 Cluster 2 2665.20 2.46E4 1797.78 2090.36 5681.17 1192.28 2916.13 3 3512.24 1.39E4 1477.76 961.50 1586.09 797.99 868.20 房产业 其他 17.44 197.48 3321.31 8896.45 987.00 2790.94

下表表示的是迭代的历史记录 Iteration History Change in Cluster Centers Iteration 1 2 1 3.774E3 .000 2 2.924E3 .000 3 4.537E3 .000 aa. Convergence achieved due to no or small change in cluster centers. The maximum absolute coordinate change for any center is .000. The current iteration is 2. The minimum distance between initial centers is 13432.633.

下表表示的是每个个案的类别情况:第三列的“cluster”表示的是该案属于哪一个类别。第四列的“distance”表示的该案例与所属类别中心之间的距离。

Cluster Membership Case Number 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 地区 北 京 天 津 河 北 山 西 内蒙古 辽 宁 吉 林 黑龙江 上 海 江 苏 浙 江 安 徽 福 建 江 西 山 东 河 南 湖 北 湖 南 Cluster 1 1 3 1 3 3 1 1 3 2 3 3 3 1 2 3 3 3 Distance 5.056E3 2.352E3 2.505E3 2.625E3 3.191E3 1.114E3 1.662E3 2.464E3 3.752E3 714.670 5.887E3 2.977E3 2.173E3 2.159E3 2.694E3 4.537E3 1.330E3 1.876E3 19 20 21 22 23 24 25 26 27 28 29 30 31 广 东 广 西 海 南 重 庆 四 川 贵 州 云 南 西 藏 陕 西 甘 肃 青 海 宁 夏 新 疆 2 1 1 1 3 1 1 1 1 1 1 1 1 2.924E3 1.937E3 3.178E3 1.397E3 1.215E3 1.653E3 791.069 3.774E3 2.596E3 1.633E3 3.052E3 2.983E3 928.110

下表表示的是最终聚类中心,可以看出第二类GDP最高,第三类其次,第一类最小。 Final Cluster Centers 农业 工业 建筑业 交通运输仓储蓄和邮政业 批发分零售业 住宿和餐饮业 金融业 房产业 其他 1 849.88 3374.78 586.13 411.59 728.87 186.17 441.78 300.31 1415.86 Cluster 2 3234.61 2.27E4 2487.22 2182.22 5474.25 997.66 2385.55 2635.78 7094.81 3 2117.84 9663.49 1319.50 1025.17 1799.72 438.48 1021.36 834.74 2937.64 下表表示的三组最终聚类中心的距离,可以看出,第二类与第三类之间的距离要比第一类与第三类之间的距离大。 Distances between Final Cluster Centers Cluster 1 2 3 1 2 2.126E4 2.126E4 6.798E3 1.453E4 3 6.798E3 1.453E4

下表表示的是每个聚类中的案例个数,可以看出,第一类有17个样本,第二类有3个样本,第三类有11个样本。

Number of Cases in each Cluster Cluster 1 2 3 Valid Missing 17.000 3.000 11.000 31.000 .000

分析上表可知,若采用K-均值聚类法分三类,第一类包括广东、山东、江苏,第二类包括河北、内蒙古、辽宁、上海、浙江、安徽、福建、河南、湖北、湖南、四川,第三类那位其他。

5、结论

结论1:不同地业的平均GDP比较

平均GDP较高的三个行业是:工业、交通运输仓储和邮政业、金融业

结论2:不同地区平均GDP比较:

比较系统聚类法和K-均值聚类法输出的结果,其我们可以清楚的看到第一类基本都为广东、山东、江苏,但是第二类却有很大出入,用系统聚类法的几种不同方法所做的分析结果基本相同,故而我们我们这里认为第二类包括北京,上海,浙江,第三类包括其他省市。

统计调查分析报告

题 目:_关于我国国内生产总值的统计分析__ 班 级:____ ____________________ __ 姓 名:____ ___________________ ___ 学 号:____ __________________ ____ 时 间:____ __________________ ____


Spss16.0与统计数据分析(8).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:建材商场公司整改规划

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: