吉林财经大学2012-2013学年第一学期
多元统计分析及SPSS统计软件应用
基于聚类分析和判别分析的实验报告
院别:会计学院
专业:会计学(注册会计师方向) 班级:1028班 姓名:邵美琪 学号:0302102840
聚类分析实验报告
城镇居民消费水平SPSS分析:
为了更加深入地了解我国城镇居民消费水平,先利用2009年全国数据(如表1所示),对全国31个省、直辖市、自治区进行聚类分析。分析采用选用了城镇居民食品、衣着、居住、家庭用品及服务设备、医疗保健、交通和通信、教育文化娱乐服务、其它商品和服务八项指标,分别用来反映较高、中等、较低居民消费水平。
各地区城镇居民家庭平均每人全年消费支出 (2009年)
表1 单位:元 地 区 食 品 衣 着 北 京 天 津 河 北 山 西 内蒙古 辽 宁 吉 林 黑龙江 上 海 江 苏 浙 江 安 徽 福 建 江 西 山 东 河 南 湖 北 湖 南 广 东 广 西 海 南 重 庆 四 川 贵 州 云 南 西 藏 陕 西 甘 肃 青 海 宁 夏 新 疆 5936 5404 3250 3071 3772 4680 3637 3397 7344 4773 5504 4051 4536 3881 3954 3272 4160 4174 5225 4129 4507 4576 4392 3756 4461 4582 3989 3359 3549 3432 3386 1796 1363 1190 1162 1857 1339 1419 1404 1593 1298 1615 1080 1172 1053 1549 1271 1210 1146 1064 856 582 1503 1178 1012 1102 1086 1210 1170 1043 1261 1357 居 住 1290 1506 1143 1319 1246 1293 1395 1027 1913 1149 1486 1220 1395 935 1280 1004 999 1075 1814 1021 1000 1121 973 748 944 690 1018 801 791 1128 857 家庭设备用品及服务 1226 912 628 564 798 608 544 548 1365 923 829 590 859 762 885 685 759 798 1053 755 586 1043 679 589 393 357 684 559 505 637 553 医疗保健 1389 1273 971 790 993 1018 1120 979 1002 808 985 717 592 550 885 876 695 785 926 538 604 983 648 535 709 352 863 747 701 922 684 交通和通信 2768 1968 1151 1096 1557 1493 1305 923 3499 1722 3291 1013 1994 1145 1720 1034 954 1234 2980 1599 1549 1189 1416 983 1587 1063 1071 894 976 1364 1199 教育文化娱乐服务 2655 1741 982 1071 1504 1284 1028 957 3139 1968 2295 1225 1505 1067 1333 1048 1208 1208 2169 1111 962 1352 1151 1146 799 466 1430 1025 889 1076 856 其它商品和服务 833 634 362 282 642 609 465 395 1136 511 579 337 598 346 407 377 308 408 627 343 296 377 422 279 208 439 440 335 332 461 437 聚类分析结果
表2 地区 北 京 天 津 河 北 山 西 内蒙古 辽 宁 吉 林 黑龙江 上 海 江 苏 浙 江 类别 1 2 3 3 4 4 3 3 1 4 2 地区 安 徽 福 建 江 西 山 东 河 南 湖 北 湖 南 广 东 广 西 海 南 重 庆 类别 3 4 3 4 3 3 3 2 3 3 3 地区 四 川 贵 州 云 南 西 藏 陕 西 甘 肃 青 海 宁 夏 新 疆 类别 3 3 3 3 3 3 3 3 3 分析数据:?
第一类:北京、上海,居民消费水平较高的地区。北京是中国的首都,是中国的政治和文化中心,是中国的象征。无论是政界、文化界还是商界都集聚于此。上海是中国第一大都市,是中国的经济中心,中国大多数金融机构的总部都建在上海。上海还是中国的科技、工业、金融、贸易、会展和航运中心。作为中国最为重要的两大城市,北京和上海的消费水平居全国之首,自然无可厚非。?
第二类:天津、浙江、广东,最为第二类的城市天津和浙江有很多相似之处:第一,二者分别都靠近第一类城市北京和上海,他们可以看作是北京和上海的外延;第二,二者分别处于京津唐和沪宁杭地区,经济发达;第三,二者是沿海城市,交通发达,为对外贸易提供极大的便利。广东与前两者有些不同,但广州处于中国的南端,海运便利。又有国家优惠政策,人口超过一亿多人,其中外国人士已达上百万,经济实力占全国的八分之一,所以天津和浙江属第二类。?
第三类:内蒙古、辽宁、江苏、福建、山东,内蒙古自治区是中国发现新矿物最多的省区。辽宁位于中国东北地区,沿海城市众多,港口密集,交通发达,公路密度居全国之首,是我国东北唯一的沿海省份。江苏和福建省地理位置沿海,拥有较丰富的矿产资源和旅游资源。山东位于中国东部沿海,经济发达。这些地区,这五个省有着一定的资源和地理优势,但较之一二两类又明显不足,居民消费水平偏低。
第四类:其他省,市,自治区,经济落后地区,他们大多是欠发达的内陆城市,无论是经济、政治还是文化发展水平都有限,居民人均收入水平不高,致使人们消费能力及消费欲望相比较其他类而言属最低水平。?
聚类树形图?
C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+、
湖北 17 ?? 宁夏 30 ?? 黑龙江 8 ?? 湖南 18 ?? 吉林 7 ?? 重庆 22 青海 29 新疆 31 云南 25 河南 16 广西 20 海南 21 河北 3 江西 14 山西 4 四川 23 安徽 12 陕西 27 贵州 24 甘肃 28 西藏 26 天津 2 浙江 11 广东 19 内蒙古 5 山东 15 辽宁 6 福建 13 江苏 10 北京 1 上海 9 ????????????????????????
??
? ? ? ?
??????????????????????????????? ? ? ? ? ? ? ? ? ? ? ????????????????? ? ? ? ? ? ? ?
?? ?? ?? ?? ?? ?? ???????????????????? ?? ?? ?? ?? ?? ?? ?? ?? ?? ???? ?? ?? ???? ?? ?? ?? ?????????????????????????????????????????????????? ???
?判别分析实验报告?
我们已对2009各地区城镇居民家庭平均每人全年消费支出进行聚类分析,将全国31个省、市、自治区2009年各地区城镇居民消费水平分为四类,考察的变量有城镇居民食品、衣着、居住、家庭用品及服务设备、医疗保健、交通和通信、教育文化娱乐服务、其它商品和服务。现从结果中选取四组样品(数据表3所示),另选3个地区作为待判样品作判别分析。
各地区城镇居民家庭平均每人全年消费支出 (2009年)
表3 单位:元
家庭设备用品及服务 1226 1365 1053 912 628 564 544 548 589 559 505 637 553 798 608 859 885 829 685 923 交通和通信 2768 3499 2980 1968 1151 1096 1305 923 983 894 976 1364 1199 1557 1493 1994 1720 3291 1034 1722 教育文化娱乐服务 2655 3139 2169 1741 982 1071 1028 957 1146 1025 889 1076 856 1504 1284 1505 1333 2295 1048 1968 其它商品和服务 833 1136 627 634 362 282 465 395 279 335 332 461 437 642 609 598 407 579 377 511 类别 序号 地 区 食 品 衣 着 居 住 医疗保健 第一类 第二类 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 北 京 上 海 广 东 天 津 河 北 山 西 吉 林 黑龙江 贵 州 甘 肃 青 海 宁 夏 新 疆 内蒙古 辽 宁 福 建 山 东 浙 江 河 南 江 苏 5936 7345 5225 5405 3251 3072 3637 3397 3756 3359 3549 3432 3386 3773 4681 4536 3954 5505 3273 4774 1796 1593 1064 1363 1190 1162 1419 1404 1012 1170 1043 1261 1357 1857 1339 1172 1549 1615 1271 1298 1290 1913 1814 1506 1143 1319 1395 1027 748 801 791 1128 857 1246 1293 1395 1280 1486 1004 1149 1389 1002 926 1273 971 790 1120 979 535 747 701 922 684 993 1018 592 885 985 876 808 第三类 第四类 待判样品
判别分析函数系数表
表4 type 食品 衣着 居住 家庭设备用品及服务 医疗保健 交通和通信 教育文化娱乐服务 其它商品和服务 (Constant) 1 .197 .205 -.236 .186 .318 .143 .296 -.532 -1342.696 2 .162 .170 -.155 .151 .232 .112 .188 -.460 -786.675 3 .115 .151 -.078 .090 .116 .066 .098 -.338 -347.882 4 .137 .177 -.103 .124 .145 .081 .125 -.384 -514.465
由表4可以得到以下分类判别函数:
Y1=0.197X1+0.205X2-0.236X3+0.186X4+0.318X5+0.143X6+0.296X7-0.532X8-1342.696 Y2=0.162X1+0.170X2-0.155X3+0.151X4+0.232X5+0.112X6+0.188X7-0.460X8-786.675 Y3=0.115X1+0.151X2-0.078X3+0.090X4+0.116X5+0.066X6+0.098X7-0.338X8-347.882 Y4=0.137X1+0.177X2-0.103X3+0.124X4+0.145X5+0.081X6+0.125X7-0.384X8-514.465
将待判样品数据代入四个函数中,每个样品对应的四个函数值进行比较,其中
函数值最大的那个是第几个函数,则判该样品为第几类。计算后发现,浙江对应的四个函数中第二个大,所以被划分为第二类。河南对应的四个函数中,第三个大,所以被划分为第三类。江苏对应的四个函数中第四个大,所以被划分为第四类。
判别分析结果
表4
家庭设备序地 区 食 品 衣着 居 住 用品号 及服务 1 2 3 4 5 6 7 8 9 10 11 12 13 15 16 17 18 19 20 北 京 上 海 广 东 天 津 河 北 山 西 吉 林 贵 州 甘 肃 青 海 宁 夏 新 疆 辽 宁 福 建 山 东 浙 江 河 南 江 苏 5936 7345 5225 5405 3251 3072 3637 3756 3359 3549 3432 3386 4681 4536 3954 5505 3273 4774 1796 1593 1064 1363 1190 1162 1419 1404 1012 1170 1043 1261 1357 1857 1339 1172 1549 1615 1271 1298 1290 1913 1814 1506 1143 1319 1395 1027 748 801 791 1128 857 1246 1293 1395 1280 1486 1004 1149 1226 1365 1053 912 628 564 544 548 589 559 505 637 553 798 608 859 885 829 685 923 交通和通信 2768 3499 2980 1968 1151 1096 1305 923 983 894 976 1364 1199 1557 1493 1994 1720 3291 1034 1722 教育文化娱乐服务 2655 3139 2169 1741 982 1071 1028 957 1146 1025 889 1076 856 1504 1284 1505 1333 2295 1048 1968 其它商品和服务 833 1136 627 634 362 282 465 395 279 335 332 461 437 642 609 598 407 579 377 511 类别 医疗保健 结果 1 1 2 2 3 3 3 3 3 3 3 3 3 4 4 4 4 . . . 1389 1002 926 1273 971 790 1120 979 535 747 701 922 684 993 1018 592 885 985 876 808 1 1 2 2 3 3 3 3 3 3 3 3 3 4 4 4 4 2 3 4 黑龙江 3397 14 内蒙古 3773 有判别分析结果可知,浙江仍为第一类,属于沪宁杭地区,经济发达;它靠近第一类城市上海,他们可以看作是上海的外延;而且是沿海城市,交通发达,为对外贸易提供极大的便利。河南属于内陆城市,没有入海港,对外贸易不发达。其水路和陆路运输没有绝对优势,经济发展不高,居民消费属偏下水平,归属于第三类。江苏地理位置优越,交通便利,服务业和工业发达,综合经济实力在全国一直处于前列,其消费能力相对较高,所以其居民消费水平被列入第四类,是合理的。?