'x6:腰围' [-0.4268] [ 0.3084] [ 0.1193]
为了结果看上去更加直观,上面定义了两个元胞数组:result1和result2,用result1存放特征值,贡献率和累积贡献率,用result2存放3个主成分表达式的系数数据,即COEFF矩阵的前3列。这样做的目的仅是为了直观,读者也可以直接对pcacov函数返回的结果进行分析。
11.3.2 结果分析
从result1的结果来看,前3个主成分的累积贡献率达到了85.8756%,因此可以用前3个主成分后续的分析i;这样做虽然会有一定的信息损失,但损失不大,不影响大局。result2中列出了前3个主成分的相关结果,可知前3个主成分的表达式分别为
y1??0.4689x1?0.4037x2?0.3936x3?0.4076x4?0.3375x5?0.4268x6
y2??0.3648x1?0.3966x2?0.3968x3?0.3648x4?0.5692x5?0.3084x6
????????????y3?0.0922x1?0.6130x2?0.2789x3?0.7048x4?0.1643x5?0.1193x6
从第一主成分y1的表达式来看,它在每个标准化变量上有近似的负载荷,说明每个标准化变量对y1的重要性都差不多。当一个人的身材“五大三粗”,也就是说又高又胖时,x1???????,x2,
,x6??L,x6都比较大,此时y1的值就比较小,反之,当一个人又矮又瘦时x1??,x2,L?都比较小,此时y1的值就比较大,所以可以认为第一主成分是身材的综合成分(或魁梧成分)。
从第二主成分y2的表达式来看,它在标准化变量x1??,x2,和x4上有近似的负载荷,在
?x3,x5x5????,
x6上有近似的正载荷,说明当x1??,
?x2,和x4增大时,y2的值减小,当x3??,
,x6增大时,y2的值增大。当一个人的身材瘦高时,y2的值比较小,当一个人的身材矮胖
?时,y2的值比较大,所以可以认为第二主成分是身材的高矮和胖瘦的协调成分
从第三主成分y3的表达式来看,它在标准化变量
??x2上有比较大的正载荷,在x4上有比较大
?的负载荷,在其它变量上的载荷比较小,,说明x2(坐高)和x4(手臂长)对y3的影响比较
大,也就是说y3反映坐高(即上半身)与手臂长之间的协调关系,这对做长袖上衣时制定衣服和袖子的长短提供了参考。所以可认为第三主成分y3是臂长成分
后3个主成分的贡献率比较小,分别只有7.1057%,4.9133%和2.1054%,可以不用对它们作出解释。最后一个主成分的贡献率非常小,它揭示了标准化变量之间的如下共线性关系
0.7856x1?0.4434x2?0.1253x3?0.3706x4?0.0335x5??0.1788x6?c
??????11.4 案例33:从样本观测值矩阵出发求解主成分
表11-2列出了2007年我国31个省,市,自治区和直辖市的农村居民家庭平均每人全年消费支出的8个主要变量数据。数据来源:中华人民共和国国家统计局网站,2008年《中国统计年鉴》。数据保存在文件 .xls中,数据格式如表11-2所列,是根据这8个主要变量的观测数据,进行主成分分析
地 区 北 京 天 津 河 北 山 西 内蒙古 辽 宁 吉 林 黑龙江 上 海 江 苏 浙 江 安 徽 福 建 江 西 山 东 河 南 湖 北 湖 南 家庭设文教娱其他商备 交通和 乐 医疗保品 食 品 衣 着 居 住 及 服 通 讯 用品及健 及 服 务 服务 务 2132.51 513.44 1023.21 340.15 778.52 870.12 629.56 111.75 1367.75 286.33 674.81 126.74 400.11 312.07 306.19 64.30 1025.72 185.68 627.98 140.45 318.19 243.30 188.06 57.40 1033.68 260.88 392.78 120.86 268.75 370.97 170.85 63.81 1280.05 228.40 473.98 117.64 375.58 423.75 281.46 75.29 1334.18 281.19 513.11 142.07 361.77 362.78 265.01 108.05 1240.93 227.96 399.11 120.95 337.46 339.77 311.37 87.89 1077.34 254.01 691.02 104.99 335.28 312.32 272.49 69.98 3259.48 475.51 2097.21 451.40 883.71 857.47 571.06 249.04 1968.88 251.29 752.73 228.51 543.97 642.52 263.85 134.41 2430.60 405.32 1498.50 338.80 782.98 750.69 452.44 142.26 1192.57 166.31 479.46 144.23 258.29 283.17 177.04 52.98 1870.32 235.61 660.55 184.21 465.40 356.26 174.12 107.00 1492.02 147.71 474.49 121.54 277.15 252.78 167.71 61.08 1369.20 224.18 682.13 195.99 422.36 424.89 230.84 71.98 1017.43 189.71 615.62 136.37 269.46 212.36 173.19 62.26 1479.04 168.64 434.91 166.25 281.12 284.13 178.77 97.13 1675.16 161.79 508.33 152.60 278.78 293.89 219.95 86.88 广 东 广 西 海 南 重 庆 四 川 贵 州 云 南 西 藏 陕 西 甘 肃 青 海 宁 夏 新 疆
2087.58 162.33 763.01 163.85 443.24 254.94 199.31 128.06 1378.78 86.90 554.14 112.24 245.97 172.45 149.01 47.98 1430.31 86.26 305.90 93.26 248.08 223.98 95.55 73.23 1376.00 136.34 263.73 138.34 208.69 195.97 168.57 39.06 1435.52 156.65 366.45 142.64 241.49 177.19 174.75 52.56 998.39 99.44 329.64 70.93 154.52 147.31 79.31 34.16 1226.69 112.52 586.07 107.15 216.67 181.73 167.92 38.43 1079.83 245.00 418.83 133.26 156.57 65.39 50.00 68.74 941.81 161.08 512.40 106.80 254.74 304.54 222.51 55.71 944.14 112.20 295.23 91.40 186.17 208.90 149.82 29.36 1069.04 191.80 359.74 122.17 292.10 135.13 229.28 47.23 1019.35 184.26 450.55 109.27 265.76 192.00 239.40 68.17 939.03 218.18 445.02 91.45 234.70 166.27 210.69 45.25