协方差矩阵特征值与特征化向量:
及相应的单位化正交化特征向量:
由各主成分的贡献率知,前五个主成分的累计贡献率已达到100%,实际应用中可只取前五个主成分
由proc princomp过程,算得样本相关矩阵为:
又由proc princomp过程,求出相关矩阵特征值:
及相应的单位化正交化特征向量:
由各主成分的贡献率知,第七个主成分的累计贡献率才达到100%
2)原始数据的变化可否由三个或者更少的主成分反映,对所选取的主成分给出合理的解释。
答:原始数据的变化可由三个或者更少的主成分反映,由以上结果可知前三个或者更少的主成分的贡献率就已经达到80%甚至90%以上,因此用前三个或者更少的主成分代替原来七个变量,其信息损失是很小的。
3)计算从样本相关矩阵出发计算的第一样本主成分的得分并予以排序。
2、从样本相关矩阵出发,做因子分析。 各因素方差解释:
公因子方差估计:
标准化得分系数:
【结果分析与讨论】
实验四 1991年全国各省、区、市城镇居民
月平均收入的数据分析
【实验目的】通过使用SAS软件对实验数据进行判别分析和聚类分析,熟悉数据分析方法,培养学生分析处理实际数据的综合能力。
【实验内容】1991年全国各省、区、市城镇居民月平均收入情况见下表,变量含义如下:X1-人均生活费收入(元/人);X2-人均全民所有制职工工资(元/人);X3-人均来源于全民标准工资(元/人);X4-人均集体所有制工资(元/人);X5-人均集体职工标准工资(元/人);X6-人均各种奖金及超额工资(元/人);X7-人均各种津贴(元/人);X8-职工人均从工作单位得到的其他收入(元/人);X9-个体劳动者收入(元/人)。
省(区\\市)名 北京 天津 河北 上海 山东 湖北 广西 海南 四川 云南 新疆 山西 内蒙古 吉林 黑龙江 江西 河南 贵州 陕西 甘肃 青海 宁夏 辽宁 类型 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 3 x1 170.03 141.55 119.4 194.53 130.46 119.29 134.46 143.79 128.05 127.41 122.96 102.49 106.14 104.93 103.34 98.089 104.12 108.49 113.99 114.06 108.8 115.96 128.46 x2 110.2 82.58 83.33 107.8 86.21 85.41 98.61 99.97 74.96 93.54 101.4 71.72 76.27 72.99 62.99 69.45 72.23 80.79 75.6 84.31 80.41 88.21 68.91 x3 59.76 50.98 53.39 60.24 52.3 53.02 48.18 45.6 50.13 50.57 69.7 47.72 46.19 44.6 42.95 43.04 47.31 47.52 50.88 52.78 50.45 51.85 43.41 x4 8.38 13.4 11 15.6 15.9 13.1 8.9 6.3 13.9 10.5 6.3 9.42 9.65 13.7 11.1 11.4 9.48 6.06 5.21 7.81 7.27 8.81 22.4 x5 4.49 9.33 7.52 8.88 10.5 8.44 4.34 1.56 9.62 5.87 3.86 6.96 6.27 9.01 7.41 7.95 6.43 3.42 3.86 5.44 4.07 5.63 15.3 x6 26.8 21.3 17.3 31 20.61 13.87 21.49 18.67 16.14 19.41 11.3 13.12 9.655 9.435 8.342 10.59 13.14 13.69 12.94 10.82 8.371 13.95 13.88 x7 16.44 12.36 11.79 21.01 12.14 16.47 26.12 29.49 10.18 21.2 18.96 7.9 20.1 20.61 10.19 16.5 10.43 16.53 9.492 16.43 18.98 22.65 12.42 x8 11.9 9.21 12 11.8 9.61 8.38 13.6 11.8 14.5 12.6 5.62 6.66 6.97 6.65 6.45 7.69 8.3 8.37 6.77 3.79 5.95 4.75 9.01 x9 0.41 1.05 0.7 0.16 0.47 0.51 4.56 3.82 1021 0.9 4.62 0.61 0.96 1.68 2.68 1.08 1.11 2.85 1.27 1.19 0.83 0.97 1.41