若用最远距离法将这些地区分为3类,则9(上海)独自为一类,1(北京)和11(浙江)为一类,剩余地区为一类。
5. Centroid cluster(重心法)
若用重心法将这些地区分为3类,则9(上海)独自为一类,1(北京)和11(浙江)为一类,剩余地区为一类。
6. Median cluster(中位数距离)
若用中位数距离法将这些地区分为3类,则9(上海)独自为一类,1(北京)和11(浙江)为一类,剩余地区为一类。
7. Ward method(离差平方和)
若用离差平方和法将这些地区分为3类,则9(上海),1(北京)和11(浙江)为一类,2(天津)、6(辽宁)、7(吉林)、10(江苏)、12(安徽)、13(福建)和14(江西)为一类,剩余地区为一类。
5.10 根据上题数据通过SPSS统计分析软件进行快速聚类运算,并与系统聚类分析结果进行比较。
解:快速聚类运算即K均值法聚类,具体步骤同5.8,聚类结果如下:
聚类的结果为9(上海)独自为一类,1(北京)、2(天津)、6(辽宁)、7(吉林)、10(江苏)、11(浙江)、13(福建)和14(江西)为一类,剩余地区为一类。
5.11下表是2003年我国省会城市和计划单列市的主要经济指标:人均GDPx1(元)、人均工业产值x2(元)、客运总量x3(万人)、货运总量x4(万吨)、地方财政预算内收入x5(亿元)、固定资产投资总额x6(亿元)、在岗职工占总人口的比例x7(%)、在岗职工人均工资额x8(元)、城乡居民年底储蓄余额x9(亿元)。试通过统计分析软件进行系统聚类分
析,并比较何种方法与人们观察到的实际情况较接近。
城市 北京 天津 石家庄 太原 呼和浩特 沈阳 大连 长春 哈尔滨 上海 南京 杭州 宁波 合肥 福州 厦门 南昌 济南 青岛 郑州 武汉 长沙 广州 深圳 南宁 海口 重庆 成都 贵阳 昆明 西安 兰州 西宁 银川 乌鲁木齐 南宁 海口 x1 31886 26433 15134 15752 18991 23268 29145 18630 14825 46586 27547 32667 32543 10621 22281 53590 14221 23437 24705 16674 21278 15446 48220 191838 8176 16442 7190 17914 11046 16215 13140 14459 7066 11787 22508 31886 26433 x2 33168 43732 13159 15831 11257 15446 27615 21045 7561 77083 43853 49823 47904 11714 21310 93126 9205 22634 35506 14023 17083 8873 55404 347519 3390 14553 5076 9289 10350 11601 8913 17136 5605 11013 17137 33168 43732 x3 30520 3507 11843 2975 3508 6612 11001 6999 6458 7212 16790 21349 24938 6034 9680 4441 5728 5810 14666 10709 11882 10609 29751 10989 7016 13284 58290 72793 18511 5126 11413 2209 2788 2146 2188 30520 3507 x4 30671 34679 10008 15248 4155 14636 21081 10892 9518 63861 14805 16815 13797 4641 8250 3055 4454 14354 30553 7847 16610 10631 28859 6793 5893 3304 32450 28798 5318 12338 9392 5581 2037 2127 12754 30671 34679 x5 593 205 49 33 21 81 111 46 76 899 136 150 139 36 67 70 31 76 120 66 80 60 275 291 36 12 162 90 40 60 65 21 8 12 41 593 205 x6 2000 934 416 197 182 557 407 294 423 2274 794 717 555 245 376 238 210 429 548 373 623 434 1089 875 170 99 1187 788 231 342 446 203 76 134 180 2000 934 x7 37.8 18.8 9.5 22.8 13.5 14.8 14.7 12.5 17.7 21.0 15.4 11.8 10.9 8.3 11.8 38.6 11.0 13.5 14.5 12.7 17.4 10.0 25.1 69.6 8.3 16.5 6.5 11.9 15.8 14.6 15.9 18.0 10.1 21.9 26.1 37.8 18.8 x8 25312 18648 12306 12679 14116 14961 17560 13870 12451 27305 22190 24667 23691 13901 15053 19024 13913 16027 15335 13538 13730 16987 28805 31053 13171 14819 12440 15274 12181 14255 13505 13489 14629 13497 16509 25312 18648 x9 6441 1825 1044 660 255 1423 1310 831 1154 6055 1134 1466 1060 359 876 397 483 758 908 1048 1286 705 3727 2199 451 284 1897 1494 345 709 1211 468 175 193 420 6441 1825 资料来源:《中国统计年鉴2004》
解:用spss对37个地区聚类分析的步骤如5.8题,不同的方法在第4个步骤的Method子对话框中选择不同的Cluster method。
1.Between-group inkage(组间平均数连接距离)
从上面的树形图可以直观地观察到,若用组间平均数连接距离将这些地区分为3类,则24(深圳)独自为一类,10(上海)和16(厦门)为一类,剩余地区为一类。
2.Within-group linkage(组内平均连接距离)
若用组内平均数连接距离将这些地区分为3类,则24(上海)独自为一类,27(重庆)和28(成都)为一类,剩余地区为一类。
3. Nearest neighbor(最短距离法)
若用最短距离法将这些地区分为2类,则24(深圳)独自为一类,剩余地区为一类。
4.Furthest neighbor(最远距离法)
若用最远距离法将这些地区分为3类,则24(深圳)独自为一类,1(北京)、2(天津)、7(大连)、10(上海)、11(南京)、12(杭州)、13(宁波)、16(厦门)、19(青岛)、23(广州)、36(海宁)和37(海口)为一类,剩余地区为一类。
5.Centroid cluster(重心法)