数据分析与建模实验指导书(5)

2018-12-21 11:37

2.根据安徽省2007年各地市经济指标数据,见表5.2,求解: (1)利用主成分分析对17个地市的经济发展进行分析,给出排名; (2)此时能否只用第一主成分进行排名?为什么? 工业总资产合工业增实收资长期负业务收地区 产值 计 加值 本 债 入 491.70 380.31 158.39 121.54 22.74 439.65 合肥 21.12 30.55 6.40 12.40 3.31 21.17 淮北 1.71 2.35 0.57 0.68 0.13 1.48 亳州 9.83 9.05 3.13 3.43 0.64 8.76 宿州 64.06 77.86 20.63 30.37 5.96 63.57 蚌埠 30.38 46.90 9.19 9.83 17.87 28.24 阜阳 31.20 70.07 8.93 18.88 33.05 31.17 淮南 79.18 62.09 20.78 24.47 3.51 71.29 滁州 47.81 40.14 17.50 9.52 4.14 45.70 六安 78.95 29.61 25.96 5.39 98.08 马鞍山 104.69 21.07 17.83 6.21 6.22 1.90 20.24 巢湖 214.19 146.78 65.16 41.62 4.39 194.98 芜湖 31.16 27.56 8.80 9.44 1.47 28.83 宣城 12.79 14.16 3.66 4.07 1.57 11.95 铜陵 6.45 5.37 2.39 2.20 0.40 5.97 池州 39.43 44.60 15.17 15.72 3.27 36.03 安庆 5.02 3.62 1.63 1.42 0.53 4.45 黄山

业务成本 344.44 17.71 1.36 7.81 52.15 21.90 26.50 59.07 34.73 84.81 16.46 171.98 25.22 10.24 4.79 27.87 4.04 利润 17.43 2.03 -0.03 0.54 4.71 3.80 2.84 6.78 4.47 3.81 1.09 11.05 1.05 0.73 0.52 3.48 0.02 实习六 聚类分析

一、实验目的

掌握MATLAB聚类分析的方法与计算步骤。 二、实例

1.2008年我国5省、区、市城镇居民人均年家庭收入如表6.1,为了研究上述5个省、区、市的城镇居民收入差异,需要利用统计资料对其进行分类,指标变量有4个,计算各省、区、市之间的前6种距离。

省(市) 北 京 上 海 安 徽 陕 西 新 疆

工薪收入 (元/人) 18738.96 21791.11 9302.38 8354.63 9422.22

经营净收财产性收入转移性收入入(元/人) (元/人) (元/人) 778.36 1399.14 959.43 638.76 938.15

452.75 369.12 293.92 65.33 141.75

7707.87 6199.77 3603.72 2610.61 1976.49

clear

x=[18738.96 778.36 452.75 7707.87 21791.11 1399.14 369.12 6199.77 9302.38 959.43 293.92 3603.72 8354.63 638.76 65.33 2610.61

9422.22 938.15 141.75 1976.49];

d1=pdist(x); % 此时计算出各行之间的欧氏距离,为了得到距离矩阵,键入命令: D= squareform(d1); % 将行向量d1转变成一个方阵,D(i,j)表示x中的第i个个体与第j个个体之间的欧氏距离。

S = tril(squareform(d1)) %提取方阵squareform(d1)的下三角部分 d2=pdist(x,'cityblock') %计算绝对距离 D2=squareform(d2)

d3=pdist(x,'minkowski',3) %计算明氏距离,d3为1行10列的行向量 d4=pdist(x,'chebychev') %计算切氏距离. d5=pdist(x,'seuclidean') d6=pdist(x,'mahalanobis') S =

1.0e+004 *

0 0 0.3462 0 1.0293 1.2763 1.1575 1.3932 1.0944 1.3080 d2 =

1.0e+004 *

0.5265 1.3881 0.1921 0.2078 D2 =

1.0e+004 *

0 0.5265 0.5265 0 1.3881 1.5600 1.6009 1.8090 1.5519 1.7281 d3 =

1.0e+004 *

0.3178 0.9689 0.1628 0.1144 d4 =

1.0e+004 *

0.3052 0.9437 0.1627 0.1068 d5 =

2.3647 2.5455 1.1651 1.1910 d6 =

2.8284 2.8284 2.8284 2.8284

%计算方差加权距离. %计算马氏距离 0 0 0 0 0 0 0 0 0 0.1428 0 0 0.1639 0.1280 0 1.6009 1.5519 1.5600 1.8090 1.3881 1.6009 1.5519 1.5600 1.8090 1.7281 0 0.2490 0.1921 0.2490 0 0.2078 0.1921 0.2078 0 1.0779 0.9990 1.2526 1.3522 1.0384 0.9317 1.2489 1.3436 3.6365 3.4377 2.7720 4.1749 2.8284 2.8284 2.8284 2.8284 1.7281 0.2490 1.2531 0.1233 1.2369 0.0993 3.3920 1.8685 2.8284 2.8284 2.利用MATLAB软件对上例中的5个省、区、市进行聚类分析。 clear

x=[18738.96 778.36 452.75 7707.87 21791.11 1399.14 369.12 6199.77 9302.38 959.43 293.92 3603.72 8354.63 638.76 65.33 2610.61 9422.22 938.15 141.75 1976.49]; d=pdist(x); % 欧氏距离

z1= linkage(d) % 类间距离为最短距离 H= dendrogram(z1) %作谱系聚类图

z2= linkage(d,'complete') %选择类间距离为最长距离时 figure(2)

H2= dendrogram(z2) %作谱系聚类图

z3= linkage(d,'average') %选择类间距离为类平均距离时 figure(3)

H= dendrogram(z3) %作谱系聚类图

3.利用K均值聚类对上例中5个省、区、市进行聚类分析. clear

x=[18738.96 778.36 452.75 7707.87 21791.11 1399.14 369.12 6199.77 9302.38 959.43 293.92 3603.72 8354.63 638.76 65.33 2610.61 9422.22 938.15 141.75 1976.49]; [a,b]=kmeans(x,3) %分为3类 a = 1 1 3 2 2 b =

1.0e+004 *

2.0265 0.1089 0.0411 0.6954 0.8888 0.0788 0.0104 0.2294 0.9302 0.0959 0.0294 0.3604 三、实习题

安徽省2008年各地市的森林资源见表6.2所示,求解以下问题:

活立木总蓄林业用地面森林面积(千森林覆盖率地区 积量(万立方积(千公顷) 公顷) (%) 米) 53.93 50.98 15.48 256.00 合肥 44.92 40.38 14.99 211.07 淮北 148.19 145.54 17.10 842.09 亳州 293.86 279.86 28.80 1238.01 宿州 86.96 74.64 12.91 302.67 蚌埠 165.62 160.25 16.46 898.76 阜阳 17.93 16.37 6.20 151.39 淮南 199.46 158.24 11.90 885.16 滁州 660.36 607.16 34.74 2278.37 六安 17.14 13.72 8.10 81.20 马鞍山 148.52 117.54 12.60 494.38 巢湖 77.27 66.69 20.85 279.34 芜湖 724.30 640.15 54.00 2446.98 宣城 36.78 32.10 32.12 137.64 铜陵 539.49 458.66 56.86 2277.00 池州 598.92 546.67 35.60 2291.09 安庆 791.50 680.96 77.80 3298.56 黄山

森林蓄积量(万立方米) 65.41 151.14 677.52 1035.67 299.32 800.96 30.17 591.17 1984.36 36.34 335.26 187.92 2323.04 115.10 2237.43 2099.21 3252.88 在进行谱系聚类时,选择合适的类间距离,进而确定最优分类数,作出谱系聚类图。


数据分析与建模实验指导书(5).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:大眼睛羚羊

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: