系统工程(基于spss的主成分分析和聚类分析)

2019-03-22 09:55

系统工程论文

主成分分析与聚类分析

姓 名: 学 号: 班 级: 学 院:

指导教师:

数据为2012年全国各省城镇民平均每人全年家庭收入来源的各项数据。数据来源位国家统计局http://data.stats.gov.cn/easyquery.htm?cn=E0103

表1-1 2012年全国各省城镇民平均每人全年家庭收入来源

城镇居城镇居城镇居城镇居城镇居民人均城镇居民人均民人均民人均民人均可支配民人均工资性经营净财产性转移性收入总收入收入收入收入收入 (元) (元) (元) (元) (元) (元) 北京市 36468.8 41103.1 27961.8 1430.2 717.6 10993.5 天津市 29626.4 32944 21523.8 1200.1 515.5 9704.6 河北省 20543.4 21899.4 13154.5 2257.5 338.5 6149 山西省 20411.7 22100.3 14973.6 1041.4 301.8 5783.4 内蒙古 23150.3 24790.8 16872.6 2698.7 564 4655.5 辽宁省 23222.7 25915.7 14846.1 2710.3 493 7866.4 吉林省 20208 21659.6 13535.3 2168.8 324 5631.5 黑龙江省 17759.8 19367.8 11700.5 1729.3 186.1 5752 上海市 40188.3 44754.5 31109.3 2267.2 575.8 10802.2 江苏省 29677 32519.1 20102.1 3421.9 690 8305.2 浙江省 34550.3 37994.8 22385.1 4694.4 1465.3 9450 安徽省 21024.2 23524.6 14812.5 2155.3 549.6 6007.1 福建省 28055.2 30877.9 19976 3337 1795.2 5769.7 江西省 19860.4 21150.2 13348.1 1946.8 527.6 5327.7 山东省 25755.2 28005.6 19856.1 2621.4 704.9 4823.2 河南省 20442.6 21897.2 13666.5 2545.1 333.8 5351.8 湖北省 20839.6 22903.9 14191 2158.3 476.2 6078.3 湖南省 21318.8 22804.6 13237.1 3008.3 867.8 5691.4 广东省 30226.7 34044.4 23632.2 3603.9 1468.7 5339.6 广西 21242.8 23209.4 14693.5 2131.8 883.7 5500.4 海南省 20917.7 22809.9 14672.3 2397.4 717.6 5022.5 重庆市 22968.1 24811 15415.4 2183.5 538.4 6673.6 四川省 20307 22328.3 14249.3 2017.8 633.8 5427.3 贵州省 18700.5 20042.9 12309.2 1982.5 355.7 5395.6 云南省 21074.5 23000.4 14408.3 2425 1000 5167.1 西藏 18028.3 20224.2 17672.1 570.9 417.9 1563.3 陕西省 20733.9 22606 15547.3 882 269.6 5907.1 甘肃省 17156.9 18498.5 12514.9 1125.7 259.6 4598.2 青海省 17566.3 19746.6 12614.4 1191.4 93 5847.8 宁夏 19831.4 21902.2 13965.6 2522.8 160.9 5252.9 新疆 17920.7 20194.6 14432.1 1633.2 145.5 3983.7

- 1 -

一 主成分分析

主成分分析(Principal Component Analysis,PCA), 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。

其分析步骤如下:

1.1.1 首先将样本数据写成矩阵的形式

Y12?Y11?YY2221Y???????Y310,1Y31,2??Y16??Y26???????Y31,6?? (1)

对样本进行标准化处理 标准化处理计算式位

Xij?131Yij??Yij31i?1131?131?Yij???Yij?31?31i?1?i?1? (2)

经过标准化处理后可得到标准化矩阵

?X11?X21X???????X31,1X12X22?X310,2?X16??X26???????X31,6?? (3)

数据标准化是为了消除量纲的影响。

矩阵元素如表1-2所示,标准化矩阵是通过MATLAB程序实现,源程序在文章最后。

表1-2 标准化数据

2.439061 -0.8772 1.061778 -1.14095 -0.72867 0.071089 -0.33951 -1.32286 0.066746 0.576813 -0.36678 0.590109 - 2 -

2.267143 1.096388 -0.45774 -0.48027 -0.01169 0.000697 2.348484 1.122627 -0.53676 -0.50658 -0.10234 0.066666 0.312863 -0.19304 -0.63611 -0.72798 -0.07163 -0.24936 2.474381 1.819538 0.013069 -0.17268 -0.74572 0.885616

-0.51513 -0.93402 2.903561 1.105046 1.938882 -0.37547 0.827552 -0.5746 0.434015 -0.47499 -0.40706 -0.32507 1.199102 -0.33807 -0.3937 -0.04287 -0.49819 -0.77307 -0.36687 -0.88808 -0.42514 -1.03718 -0.96713 -0.57956 -0.90649

(续)表1-2 标准化数据 -0.57279 -0.6472 -0.03058 -0.67241 -0.91712 -1.03972 -0.53436 -1.0176 2.897085 3.112406 0.082208 -0.04209 1.058788 0.757634 1.405777 0.243774 1.88148 1.246036 2.864373 2.184523 -0.29258 -0.37397 -0.04606 -0.10768 0.812207 0.730657 1.308461 3.010337 -0.64932 -0.68725 -0.28505 -0.16275 0.380661 0.705007 0.488208 0.281072 -0.53709 -0.61914 0.400749 -0.64787 -0.38584 -0.50693 -0.04262 -0.29142 -0.40076 -0.711 0.93169 0.688847 1.287955 1.512829 1.614393 2.193034 -0.33994 -0.39943 -0.07299 0.728648 -0.39996 -0.40396 0.231449 0.312863 -0.09931 -0.24499 -0.01373 -0.13572 -0.47232 -0.49446 -0.20367 0.103092 -0.81569 -0.9095 -0.24413 -0.59305 -0.37134 -0.46044 0.263085 1.019773 -0.78845 0.237783 -1.86217 -0.43735 -0.4306 -0.21678 -1.50557 -0.80858 -1.04773 -0.8655 -1.22623 -0.83361 -0.86021 -0.84421 -1.15092 -1.25065 -0.53634 -0.55515 0.375188 -1.08068 -0.7929 -0.45535 -0.64451 -1.11923 -0.24985 -0.18863 2.377188 1.108555 1.690185 -0.05903 -0.17964 -0.4042 -0.66052 -0.39196 -0.02285 -0.21942 -0.39816 -0.31646 -0.55926 0.279599 -0.3536 -0.36971 -0.4858 -2.31676 -0.10983 -0.77484 -0.13996 -0.44221 -1.08704 1.1.2 计算6个指标的协方差矩阵

?r11?r1T21R?XX????31???r31,1r12r22?r31,2?r16??r26???????r31,6?? (4)

矩阵(4)是一个实对称矩阵。

经计算,矩阵(4)的每一个元素如表格3所示。

- 3 -

表1-3 相关系数矩阵

1 0.998144 0.998144 0.95094 1 1 0.44422 0.550481 0.808298 0.251428 0.471459 0.662525 1 0.704031 0.24619 1 0.201289 1 0.959479 0.422711 0.542934 0.805363 0.95094 0.959479 0.44422 0.422711 0.251428 0.805363 0.550481 0.542934 0.471459 0.704031 0.808298

1.1.3 求相关系数的特征矩阵和特征值,

表1-4 特征向量系数

-1.2E-05 0.85499 -0.7902 0.662525 0.24619 0.201289 -0.12139 0.047951 -0.12667 0.485709 -0.31736 -0.11754 0.078445 -0.14248 0.484348 0.554972 -0.36132 -0.34513 0.437326 -0.22413 0.448163 0.103575 -0.09384 -0.45755 -0.51248 0.658657 0.273208 0.047431 -0.02824 0.629015 0.384637 0.59077

表1-5 特征值

5.21E-11 0 0 0 0 0

表1-6 特征值及主成分贡献率

主成分 1 2 3 4 5

0.323013 0.233681 -0.16769 0.497312 -0.62426 -0.36136 0.386865 0 0.002164 0 0 0 0 0 0 0.180652 0 0 0 0 0 0 0.450666 0 0 0 0 0 0 1.233975 0 0 0 0 0 0 4.132542 特征值 4.132542 1.233975 0.450666 0.180652 0.002164 - 4 -

贡献率 69% 21% 8% 2% 0% 累计贡献率 69% 90% 98% 100% 100%


系统工程(基于spss的主成分分析和聚类分析).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:不同土地使用权对房地产估价的影响

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: