聚类分析方法在我国空气污染区域划分中的应用(3)

2019-05-18 22:15

表2.4.1 主要聚类方法的比较

适合的类型聚类方法算法效率数据类型 k-means O(knt) 能够发现的数据形状凸状、球状凸状、球状凸状、消除噪声的能力弱处理高维数据的能力较低聚类标准类的标识数值型距离代表点 K-prototype 划分的方法 PAM O(knt) 任意弱较低距离代表点 O(tk(n?k)) 2数值型球状凸状、球状凸状、球状凸状、较强较低距离代表点 CLARA O(ks?k(n?k)) 数值型 2较强较低距离代表点 CLARANS O(n) 2数值型较强一般距离代表点 BIRCH 层次的方法 CURE ROCK Chameleon DBSCAN 基于密度的方法 DENCLUE OPTICS O(n) O(n) O(n) O(n) 222数值型数值型符号型数值型数值型球状任意任意任意任意较强较强一般一般较强较低一般较高较高一般距离距离链接链接密度代表点代表点代表点代表点密度区域密度区域密度区O(nlogn) O(nlogn) 数值型任意较强一般密度比DBSCAN快数值型任意强高较低较高高密度域网格网格网格基于网络的方法 STING Wavecluster CLIQUE O(n) O(n) 数值型数值型数值型 11

任意任意凸状、球状强强一般密度密度密度较快

注：表中n为数据对象的数目，k为分类数目，t为迭代次数，s为抽样规模。

三、聚类方法在我国空气污染区域划分中的应用

（一）数据的选择

本文中所用到的数据来自《2010中国统计年鉴》中2009年各地区废气排放及处理情况，以及各地区二氧化硫排放量，所用的数据见附录A。

（二）聚类方法的选择

本文对所选择的数据采用不同的系统聚类法，以距离为聚类的标准。数据处理的时候采用了不同的距离，以及不同的聚类方法，从各个不同的角度对各地的空气污染情况进行了分析！能较准确的反应全国各地的空气质量。

（三）聚类分析

3.3.1 按各地区的空气污染严重程度不同对污染区域进行划分

运用SPSS软件并采用组内连接聚类方法，对各污染区域按空气污染严重程度的不同进行划分，可得如下聚类分析：

图3.3.1空气污染严重程度不同对污染区域进行划分参数设置

所得聚类分析的柱形图如下：

图3.3.2 空气污染程度聚类分析的柱形图

所得聚类分析的树状图如下：

图3.3.3 空气污染程度组内连接聚类分析的树状图

由上面的树状图，我们按各地区空气污染程度不同对各省份进行划分，所得结果如下表所示：

表3.3.1 运用组内连接聚类法按各地区空气污染程度不同进行划分的结果类别第一类第二类第三类第四类

对应编号对应地区空气质量排名 26、28、10、23、24 云南、甘肃、上海、重庆、四川 1 2、3、29、30、22 北京、天津、青海、宁夏、海南 2 8、9、31 吉林、黑龙江、新疆 3 11、20、12、13、15、18、27 江苏、广东、浙江、安徽、江西、湖北、陕西 4 第五类第六类第七类 4、5、6、7、16 河北、山西、内蒙古、辽宁、山东 19、21 湖南、广西 6 17 河南 5 7

3.3.2按各地区的废气处理情况进行区域划分的中位数聚类分析

运用SPSS软件并采用中位数聚类分析法，对各污染区域按废气处理情况的不同进行划分，可得如下聚类分析：

聚类表阶群集组合群集 1 群集 2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

2 3 7 6 26 5 18 1 22 13 4 12 24 7 5 15 3 22 4 6 12 14 10 29 16 27 30 19 20 23 25 9 21 31 8 11 18 24 28 17 13 15 系数 .992 .986 .986 .985 .966 .959 .933 .900 .879 .853 .849 .804 .769 .701 .625 .615 .490 .469 .399 .303 .231 15

首次出现阶群集群集 1 0 0 0 0 0 0 0 0 0 0 0 0 0 3 6 0 2 9 11 4 12 群集 2 下一阶 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 7 13 0 0 10 16 22 17 14 20 26 15 16 22 18 20 19 21 17 25 24 21 23 27 25 24 26

共7页:

聚类分析方法在我国空气污染区域划分中的应用(3).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档