素。根据前三个主成分得分,用其贡献率加权,即得十个城市各自的总得分 F = 43.12%princ(:,1)+29.34%princ(:,2)+11.97%princ(:,3) =[0.0970,-0.6069,-1.5170,1.1801,0.0640,-0.8178,-0.9562,1.1383,0.1107,1.3077]'
根据总得分排序,结果见表1。
三、 聚类分析
我们对苏州所辖张家港市2003年七条河流中主要污染因子(指标),即CODmn,BOD5,非 离子氨,氨氮,挥发酚,石油类共6个变量(资料见表2,来源于张家港市2003年环境质量报 告书),进行聚类分析。
我们利用Matlab6.5中的cluster命令实现。具体程序如下
x= [3.14 8.41 23.78 25.79 4.17 6.47 5.47 9.57 26.48 23.79 6.42 6.58 3.1 4.31 21.2 22.48 5.34 6.54 5.67 9.54 10.23 20.87 4.2 6.8 6.81 9.05 16.18 24.56 5.2 5.45 6.21 7.08 21.05 31.56 6.15 8.21
4.87 8.97 26.54 34.56 5.58 8.07];
[n,m]=size(x); stdr=sta(x);
xx=x ./stdr(ones(n,1),:); %标准化变换
y=pdist(xx); %计算各样本间距离(这里为欧氏距离) z=linkage(y); %进行聚类(这里为最短距离法) h=dendrogram(z); % 画聚类谱系图 t=cluster(z,3) %将全部样本分为3类 find(t==2); %找出属于第2类的样品编号
执行后得到所要结果,聚类谱系图见图1.
t=[3,1,3,1,1,2,2]' 即全部样本分为3类,结果见表2.
从图1可以看出:七条河流中,二干河、横套河、四千河属于一类,污染较重,主要是CODmn、BOD5超标多;华妙河、盐铁塘属于一类,污染一般,主要是氨氮、石油类超标;张家港河、东横河属于一类,污染较轻。总的来说,各河流都存在不同程度的污染,因此全市应对各河流严格监督管理,着力实施水污染防治工作,太湖流域水污染源应限期治理达标排放,巩固水污染防治工作成果,加大投入,新建或改、扩建废水治理工程,确保达标排放。