matlab主成分分析案例

2019-04-08 22:14

1.设随机向量X=(X1,X2,X3)T的协方差与相关系数矩阵分别为

?14??10.8???,???R??425??0.81??

????分别从?,R出发,求X的各主成分以及各主成分的贡献率并比较差异况。

解答:

>> S=[1 4;4 25];

>> [PC,vary,explained]=pcacov(S); 总体主成分分析:

>> [PC,vary,explained]=pcacov(S) 主成分交换矩阵: PC =

-0.1602 -0.9871 -0.9871 0.1602 主成分方差向量: vary = 25.6491 0.3509

各主成分贡献率向量 explained = 98.6504 1.3496

则由程序输出结果得出,X的主成分为: Y1=-0.1602X1-0.9871X2 Y2=-0.9871X1+0.1602X2

两个主成分的贡献率分别为:98.6504%,1.3496%;则若用第一个主成分代替原来的变量,信息损失率仅为1.3496,是很小的。

2.根据安徽省2007年各地市经济指标数据,见表5.2,求解: (1)利用主成分分析对17个地市的经济发展进行分析,给出排名; (2)此时能否只用第一主成分进行排名?为什么?

工业总资产合工业增实收资长期负业务收业务成地区 产值 计 加值 本 债 入 本 第 1 页 共 6 页

利润 合肥 491.70 380.31 158.39 121.54 22.74 439.65 344.44 17.43 淮北 21.12 30.55 6.40 12.40 3.31 21.17 17.71 2.03 亳州 1.71 2.35 0.57 0.68 0.13 1.48 1.36 -0.03 宿州 9.83 9.05 3.13 3.43 0.64 8.76 7.81 0.54 蚌埠 64.06 77.86 20.63 30.37 5.96 63.57 52.15 4.71 阜阳 30.38 46.90 9.19 9.83 17.87 28.24 21.90 3.80 淮南 31.20 70.07 8.93 18.88 33.05 31.17 26.50 2.84 滁州 79.18 62.09 20.78 24.47 3.51 71.29 59.07 6.78 六安 47.81 40.14 17.50 9.52 4.14 45.70 34.73 4.47 马鞍山 104.69 78.95 29.61 25.96 5.39 98.08 84.81 3.81 巢湖 21.07 17.83 6.21 6.22 1.90 20.24 16.46 1.09 芜湖 214.19 146.78 65.16 41.62 4.39 194.98 171.98 11.05 宣城 31.16 27.56 8.80 9.44 1.47 28.83 25.22 1.05 铜陵 12.79 14.16 3.66 4.07 1.57 11.95 10.24 0.73 池州 6.45 5.37 2.39 2.20 0.40 5.97 4.79 0.52 安庆 39.43 44.60 15.17 15.72 3.27 36.03 27.87 3.48 黄山 5.02 3.62 1.63 1.42 0.53 4.45 4.04 0.02 解答: (1)

>> clear

>> A=[491.70,380.31,158.39,121.54,22.74,439.65,344.44,17.43; 21.12,30.55,6.40,12.40,3.31,21.17,17.71,2.03; 1.71,2.35,0.57,0.68,0.13,1.48,1.36,-0.03; 9.83,9.05,3.13,3.43,0.64,8.76,7.81,0.54;

64.06,77.86,20.63,30.37,5.96,63.57,52.15,4.71; 30.38,46.90,9.19,9.83,17.87,28.24,21.90,3.80; 31.20,70.07,8.93,18.88,33.05,31.17,26.50,2.84; 79.18,62.09,20.78,24.47,3.51,71.29,59.07,6.78; 47.81,40.14,17.50,9.52,4.14,45.70,34.73,4.47; 104.69,78.95,29.61,25.96,5.39,98.08,84.81,3.81; 21.07,17.83,6.21,6.22,1.90,20.24,16.46,1.09;

214.19,146.78,65.16,41.62,4.39,194.98,171.98,11.05; 31.16,27.56,8.80,9.44,1.47,28.83,25.22,1.05; 12.76,14.16,3.66,4.07,1.57,11.95,10.24,0.73; 6.45,5.37,2.39,2.20,0.40,5.97,4.79,0.52;

39.43,44.60,15.17,15.72,3.27,36.03,27.87,3.48; 5.02,3.62,1.63,1.42,0.53,4.45,4.04,0.02]; 得到的相关系数矩阵为: >> R=corrcoef(A) R =

1.0000 0.9877 0.9988 0.9820 0.4281 0.9999 0.9980 0.9510

第 2 页 共 6 页

0.9877 1.0000 0.9884 0.9947 0.5438 0.9885 0.9835 0.9485

0.9988 0.9884 1.0000 0.9824 0.4294 0.9984 0.9948 0.9462

0.9820 0.9947 0.9824 1.0000 0.5051 0.9829 0.9763 0.9391

0.4281 0.5438 0.4294 0.5051 1.0000 0.4311 0.4204 0.4557

0.9999 0.9885 0.9984 0.9829 0.4311 1.0000 0.9986 0.9530

0.9980 0.9835 1.0000 0.9569

0.9510 0.9485 0.9569 1.0000

计算特征值与特征向量: >> [v,d]=eig(corrcoef(A)) v =

-0.3723 0.1179 -0.5641 0.3041

-0.3741 -0.0343 -0.1535 0.5841

-0.3719 0.1152 0.0383 -0.5244

-0.3713 0.0096 0.0303 -0.2845

-0.1949 -0.9689 0.0151 -0.0593

-0.3725 0.1143 0.7946 0.2988

-0.3716 0.1272 -0.1557 -0.3428

-0.3613 0.0596 0.0022 -0.0096 d =

7.1135 0 0 0 0 0 0 0

0 0.7770 0 0 0 0 0 0

0 0 0.0810 0 0 0 0 0

0 0 0 0.0237 0 0 0 0

0 0 0 0 0.0041 0

0.9948 0.9763 0.9462 0.9391 0.1411 -0.2543 0.1606 0.2247 0.1957 -0.1954 0.2368 0.7875 -0.0004 -0.1242 0.1222 -0.2302 0.0353 -0.3800 -0.9185 0.1165 第 3 页 共 6 页

0.4204 0.4557 -0.0459 -0.1514 -0.6909 0.2168 0.0119 0.0924 0.6591 -0.0872 0.9986 0.9530 0.5917 -0.6284 -0.1351 0.2385 0.0628 0.2259 -0.3521 0.0302 0 0

0 0 0 0 0 0.0006 0 0

0 0 0 0 0 0 0.0000 0

0 0 0 0 0 0 0 0.0001

各主成分贡献率:

>> w=sum(d)/sum(sum(d)) w =

0.8892 0.0971 0.0101 0.0030 0.0000 0.0000

计算各个主成分得分:

>> F=[A-ones(17,1)*mean(A)]*v(:,8) F =

224.3503 -24.0409 -40.0941 -35.9075 4.7573 -12.6102 -2.8573 1.8038 -13.9012 13.4541 -29.3847 62.3383 -23.3175 -32.4285 -38.1309 -14.8637 -39.1675

>> [F1,I1]=sort(F,'descend')

F1按从大到小的顺序给个主成分得分排名: F1 =

224.3503

第 4 页 共 6 页

0.0005 0.0001 62.3383 13.4541 4.7573 1.8038 -2.8573 -12.6102 -13.9012 -14.8637 -23.3175 -24.0409 -29.3847 -32.4285 -35.9075 -38.1309 -39.1675 -40.0941

I1给出各个名次的序号:I1 =

1 12 10 5 8 7 6 9 16 13 2 11 14 4 15 17 3

>> [F2,I2]=sort(I1) F2 =

1 2

第 5 页 共 6 页

3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

I2给出个城市排名,即所求排名: I2 =

1 11 17 14 4 7 6 5 8 3 12 2 10 13 15 9

16

(2)由于第一主成分的贡献率大于80%,其他各成分贡献率都太小,所以只能用第一主成分进行排名。

第 6 页 共 6 页


matlab主成分分析案例.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:世界区域地理基础知识复习4(西亚)

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: