W1 W2 W3 W4 W5 W6 W7 W8 W9
11.5 9.0 7.5 9.1 11.6 13.0 11.6 10.7 11.1 95.3 97.7 110.7 89.0 88.0 87.7 79.7 119.3 87.7 26.4 30.8 39.7 35.4 29.3 24.6 25.6 29.9 32.2 39.2 46.8 39.1 35.3 37.0 44.8 43.7 38.8 35.6 19 17 17 18 20 19 19 19 18 2 6 3 2 7 7 5 5 3 2、我国十六个地区农民某年支出情况的抽样调查汇总如下:六项指标分别为:食品X1、衣着X2、燃料X3、住房X4、生活用品及其它X5、文化生活服务X6支出,试对数据在六个方面进行因子分析。
北京 天津 河北 山西 内蒙 辽宁 吉林 X1 190.33 135.20 95.21 104.78 128.41 145.68 159.37 X2 43.77 36.40 22.83 25.11 27.63 32.83 33.38 29.57 38.64 29.12 32.75 23.09 21.26 21.50 30.26 23.26 X3 9.73 10.47 9.30 6.40 8.94 17.79 18.37 13.24 12.53 11.67 12.72 15.62 16.96 17.64 12.20 8.46 X4 60.54 44.16 22.44 9.89 12.58 27.29 11.81 13.76 115.65 42.60 47.12 23.54 19.52 19.19 33.61 20.20 X5 49.01 36.49 22.81 18.17 23.99 39.09 25.29 21.75 50.82 27.30 34.35 18.18 21.75 15.97 33.77 20.50 X6 9.04 3.94 2.80 3.25 3.27 3.47 5.22 6.04 5.89 5.74 5.00 6.39 6.73 4.94 3.85 4.30 黑龙江 116.22 上海 江苏 浙江 安徽 福建 江西 山东 河南 221.11 144.98 169.92 153.11 144.92 140.54 115.84 101.18
3、某化工厂邻近地区挑选有代表性的8个大气取样点,观测六种气体(氯CL,硫化氢H2S,二氧化硫SO2,甲烷CH4,环氧氯丙烷ECH,环己烷CYCL)的浓度,见下表。使用因子分析法分析这些数据。
1 2 3 Cl 0.056 0.049 0.038 H2S 0.084 0.055 0.130 SO2 0.031 0.100 0.079 CH4 0.038 0.110 0.170 ECH 0.0081 0.0220 0.0580 CYCL 0.0220 0.0073 0.0430 4 5 6 7 8 0.034 0.084 0.064 0.048 0.069 0.095 0.066 0.072 0.089 0.087 0.058 0.029 0.100 0.062 0.027 0.160 0.320 0.210 0.260 0.050 0.2000 0.0120 0.0280 0.0380 0.0890 0.0290 0.0410 1.3800 0.0360 0.0210
4、影响小麦粮食产量的指标有9个:粮食播种面积(x1,万亩)、小麦播种面积(x2,万亩)、小麦良种推广比例(x3,%)、化肥用量(x4,万吨)、肥猪出栏(x5,万头)、农业人口(x6,万人)、耕牛数(x7,万头)、小麦抽穗扬花期气温(x8,℃)、。小麦抽穗扬花期降水量(x9,毫米)。抽取28年的数据,试就这些数据进行因子分析。 ID 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
X1 4088 4216 4233 4284 4639 4786 4995 4919 4672 4328 4295 4170 3909 4063 3887 3872 3937 4039 4354 4465 4436 4367 4590 4663 5041 5257 4819 4486 X2 1569 1685 1702 1863 2034 2073 2708 2608 2351 2097 2067 1920 1806 2003 1900 1890 1964 2094 2496 2604 2605 2580 2784 2808 3060 3428 3261 3055 X3 26.9 28.0 28.1 30.4 32.9 32.5 43.4 42.4 40.3 38.8 38.8 36.8 37.0 39.4 39.1 39.1 39.9 41.5 45.9 46.7 49.9 50.2 51.6 54.2 54.6 58.7 60.9 80.0 X4 0.37 1.03 2.30 2.47 5.46 6.86 17.16 18.28 24.55 35.56 44.65 67.97 119.54 105.25 58.72 98.53 123.30 168.40 168.15 208.38 205.81 231.38 243.96 365.28 479.23 542.86 570.00 580.00 X5 648 1146 1308 1219 1053 1080 324 214 383 754 1256 1524 1698 1728 1584 1629 1610 1539 1898 1974 1895 1807 1754 1831 2155 2736 3100 3200 X6 5694.0 5839.0 5894.3 6008.9 6096.1 6188.5 5552.3 5487.4 5672.4 5849.7 6042.9 6227.7 6413.0 6627.2 6875.8 7115.7 7356.9 7567.7 7770.4 8002.2 8205.5 8402.5 8504.4 8566.0 8575.2 8594.9 8615.0 8670.0 X7 459.0 465.1 490.5 492.7 509.7 515.6 503.5 473.2 473.8 502.0 523.9 552.4 574.8 587.4 600.1 605.2 617.5 641.7 641.0 633.0 625.1 615.2 601.9 582.3 594.8 626.0 627.0 627.0 X8 17.0 15.1 15.2 14.7 16.4 16.1 15.8 15.5 15.2 16.1 16.8 15.8 16.3 15.0 14.2 16.4 13.6 16.3 15.4 17.1 15.8 16.1 13.8 15.4 15.9 15.4 15.2 13.5 X9 46.9 69.7 73.1 58.3 63.6 52.0 40.5 64.1 59.7 69.4 61.9 55.7 28.3 62.0 85.6 74.6 49.4 33.6 71.6 83.0 62.7 38.5 42.1 81.0 38.4 51.5 39.2 53.9 第十一章 聚类分析
实例:我国十六个地区农民某年支出情况的抽样调查汇总如下:六项指标分别为:食品、衣
着、燃料、住房、生活用品及其它、文化生活服务支出,试对上述分析十六个地区进行分类。(Sasuser.D13)
北京 190.33 43.77 9.73 60.54 49.01 9.04 天津 135.20 36.40 10.47 44.16 36.49 3.94 河北 95.21 22.83 9.30 22.44 22.81 2.80 山西 104.78 25.11 6.40 9.89 18.17 3.25 内蒙 128.41 27.63 8.94 12.58 23.99 3.27 辽宁 145.68 32.83 17.79 27.29 39.09 3.47 吉林 159.37 33.38 18.37 11.81 25.29 5.22 黑龙江 116.22 29.57 13.24 13.76 21.75 6.04 上海 221.11 38.64 12.53 115.65 50.82 5.89 江苏 144.98 29.12 11.67 42.60 27.30 5.74 浙江 169.92 32.75 12.72 47.12 34.35 5.00 安徽 153.11 23.09 15.62 23.54 18.18 6.39 福建 144.92 21.26 16.96 19.52 21.75 6.73 江西 140.54 21.50 17.64 19.19 15.97 4.94 山东 115.84 30.26 12.20 33.61 33.77 3.85 河南 101.18 23.26 8.46 20.20 20.50 4.30
本章作业:
1、现收集到6个矿石的样本,测定了其中7种金属(银Ag,铝Al,铜Cu,钙Ca,锑Sb,铋Bi和锡Sn)的含量见下表,试对这几块矿石进行分类。
样品号 1 2 3 4 5 6 Ag 0.05798 0.08441 0.07217 0.15010 5.74400 0.21300 Al 5.5150 3.9700 1.1530 1.7020 2.8540 0.7058 Cu 347.10 347.20 54.85 307.50 229.60 240.30 Ca 21.910 19.710 3.052 15.030 9.657 13.910 Sb 8586 7947 3860 12290 8099 8980 Bi 1742 2000 1445 1461 1266 2820 Sn 61.69 2440 9497 6380 12520 4135
2、10个同学按学习成绩分类,您觉得用什么方法分比较好,分为多少类比较好?您的分类结果如何,试解释您的分类结果。(数据为距离矩阵)
中国革微积分 植物学 化学 英语线性 体育 英语命史 中国革命史 微积分 植物学 化学 英语(I) 线性代数 体育 英语(II) (I) 代数 (II) .0 31.4 28.2 29.9 17.2 40.9 41.8 17.3 31.4 .0 42.6 32.3 33.9 18.6 28.5 40.1 28.2 42.6 .0 33.3 23.5 49.9 50.8 21.6 29.9 32.3 33.3 .0 28.8 43.5 54.8 36.7 17.2 33.9 23.5 28.8 .0 38.7 42.8 16.5 40.9 18.6 49.9 43.5 38.7 .0 28.6 46.4 41.8 28.5 50.8 54.8 42.8 28.6 .0 43.9 17.3 40.1 21.6 36.7 16.5 46.4 43.9 .0
3、为了研究某地的地层结构,从地面向下钻井,每隔十米取岩心样本进行分析,200米井中取得19个样本的四项数据如下表。按此数据你如何将此地的岩层进行分类。(提示:对岩层分类不可以颠倒顺序。)
样本顺序 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
X1 11.03 5.47 3.58 2.01 2.13 2.06 1.63 1.17 1.03 0.69 0.77 0.59 0.65 0.51 0.73 0.53 0.36 0.52 0.34 X2 50.30 19.30 9.85 4.17 5.65 1.74 2.04 1.60 2.34 1.33 1.40 1.25 1.19 0.93 1.13 0.82 0.52 1.03 0.49 X3 11.27 7.18 2.11 1.58 2.11 1.57 1.46 0.76 0.98 0.58 0.42 0.14 0.38 0.25 0.55 0.34 0.21 0.55 0.16 X4 11.81 5.20 3.14 1.47 1.04 0.17 1.04 0.89 0.53 0.48 0.52 0.30 0.49 0.16 0.35 0.16 0.19 0.30 0.18 第十二章 判别分析
例1 1995年的世界经济研究中,调查了一些发达国家(A)和发展中国家(B)的数据,变
量为寿命(life)、识字率(literacy)、人均GDP(GDP),试对四个未知国家进行分类。
A 美国 76 99 5374 A 日本 79.5 99 5359 A 瑞士 78 99 5372 A 阿根廷 72.1 95.9 5242 A 阿联酋 73.8 77.7 5370 B 保加利亚 71.2 93 4250 B 古巴 75.3 94.9 3412 B 巴拉圭 70 91.2 3390 B 格鲁吉亚 72.8 99 2300 B 南非 62.9 80.6 3799
中国 68.5 79.3 1950 罗马尼亚 69.9 96.9 2840 希腊 77.6 93.8 5233 哥伦比亚 69.3 90.3 5158
例3 1991年调查了27个省市自治区的城镇居民月人均消费,调查的指标为:x1 粮食支出(元/人)、x2 副食支出(元/人)、x3 烟、酒、茶支出(元/人)、x4 其它副食支出(元/人)、x5 衣着商品支出(元/人)、x6 日用品支出(元/人)、x7 燃料支出(元/人)和x8 非商品支出(元/人),试对这些数据进行逐步判别分析。
1 8.35 23.53 7.51 8.62 17.42 10.00 1.04 11.21 1 9.25 23.75 6.61 9.19 17.77 10.48 1.72 10.51 1 8.19 30.50 4.72 9.78 16.28 7.60 2.52 10.32 1 7.73 29.20 5.42 9.43 19.29 8.49 2.52 10.00 1 9.42 27.93 8.20 8.14 16.17 9.42 1.55 9.76 1 9.16 27.98 9.01 9.32 15.99 9.10 1.82 11.35 1 10.06 28.64 10.52 10.05 16.18 8.39 1.96 10.81 1 9.09 28.12 7.40 9.62 17.26 11.12 2.49 12.65 1 9.41 28.20 5.77 10.8 16.36 11.56 1.53 12.17 1 8.70 28.12 7.21 10.53 19.45 13.3 1.66 11.96 1 6.93 29.85 4.54 9.49 16.62 10.65 1.88 13.61 1 8.67 36.05 7.31 7.75 16.67 11.68 2.38 12.88 1 9.98 37.69 7.01 8.94 16.15 11.08 0.83 11.67 1 6.77 38.69 6.01 8.82 14.79 11.44 1.74 13.23 1 8.14 37.75 9.61 8.49 13.15 9.76 1.28 11.28 1 7.67 35.71 8.04 8.31 15.13 7.76 1.41 13.25