城市表层土壤重金属污染分析
摘 要
本文主要是由采样数据对该城市八种重金属元素污染的程度进行分析。首先我们对采样数据进行预处理,主要是修改异常数据和利用QQ图做正态性检验。
然后对第一问我们对八种重金属含量分成五段分别来表示不同的浓度,再利用Matlab软件根据取样点的坐标,做出各种重金属元素的空间分布图,并用不同的颜色表示重金属元素的浓度(图中重金属浓度由高到低分别用黑、蓝、红、黄、绿表示)。
第二问为确定污染原因,我们从两方面来坐分析,一方面利用Excel对五种功能区作单因子方差分析,得出不同功能区的污染程度有非常显著性的差异,并得到绝大数都是由于工业污染造成的;另一方面,求出它们的尼梅罗综合评价指数也说明绝大数都是由于工业污染造成的。
第三问为找出传播特征和确定污染源,我们主要是利用地统计学的半方差函数(或称变异函数)模型,先通过GS+V9.0软件拟合估计出半方差函数的三个参数,并由此确定各重金属污染的传播特征,再进行克里格插值来推出它们的污染源,另外我们还求出各种重金属元素以及海拔间的相关系数,从相关性的角度说明它们的传播特征和污染源的确定。
最后说明该模型的缺点以及需要改进的地方。
关键词: 正态性检验;单因子方差分析;半方差函数;克里格插值;
一、 问题提出
随着城市经济的快速发展和城市人口的不断增加,人类活动对城市环境质量的影响日显突出。对城市土壤地质环境异常的查证,以及如何应用查证获得的海量数据资料开展城市环境质量评价,研究人类活动影响下城市地质环境的演变模式,日益成为人们关注的焦点。
按照功能划分,城区一般可分为生活区、工业区、山区、交通区及公园绿地区等,分别记为1类区、2类区、……、5类区,不同的区域环境受人类活动影响的程度不同。
现对某城市城区土壤地质环境进行调查。为此,将所考察的城区划分为间距1公里左右的网格子区域,按照每平方公里1个采样点对表层土(0-10 厘米深度)进行取样、编号,并用GPS记录采样点的位置。应用专门仪器测试分析,获得了每个样本所含的多种化学元素的浓度数据。另一方面,按照2公里的间距在那些远离人群及工业活动的自然区取样,将其作为该城区表层土壤中元素的背景值。
附件1列出了采样点的位置、海拔高度及其所属功能区等信息,附件2列出了8种主要重金属元素在采样点处的浓度,附件3列出了8种主要重金属元素的背景值。
现要求你们通过数学建模来完成以下任务:
(1) 给出8种主要重金属元素在该城区的空间分布,并分析该城区内不同区域重金属的污染程度。
(2) 通过数据分析,说明重金属污染的主要原因。
(3) 分析重金属污染物的传播特征,由此建立模型,确定污染源的位置。 (4) 分析你所建立模型的优缺点,为更好地研究城市地质环境的演变模式,还应收集什么信息?有了这些信息,如何建立模型解决问题?
二、 问题分析
本文对该城市八种金属元素污染程度的分析,首先是主要将异常的数据进行处理,我们采用统计中常用的原则,即以采用数据超出A?3S范围的为异常数据,其中 A、S 分别为采用数据中各重金属的样本均值和样本标准差。当采用数据大于A?3S时,以A?3S代替;当采用数据小于A?3S时,以A?3S代替。然后利用SPSS作QQ图做正态性分析。处理完数据之后,再利用Matlab软件根据取样点的坐标,做出各种重金属元素的空间分布图,并用不同的颜色表示重金属元素的浓度,从而解决第一问。
对于第二问为确定重金属污染的主要原因,我们对城市五种不同的功能区进行八种重金属污染指数的单因子方差分析,分析这五种功能区的污染程度是否有显著性差异,若差异很显著,则主要看是那个因子(即功能区)影响最大,从而确定污染的原因,另一方面比较这八种元素在不同功能区的尼梅罗综合指数,找出最低最高的尼梅罗综合指数,从而根据该数据也可以得到第二问的答案。
2
对于第三问,为分析出重金属污染物的传播特征,并由此确定污染源的位置,我们主要根据地统计学半方差函数模型和克里格插值法来做的。其总的思想就是根据已知采样点提供的信息拟合半方差函数,然后根据该函数对未知点进行估计和模拟。因此,半方差函数是我们利用的主要工具,一方面,利用半方差函数对重金属的空间分布进行结构分析和变异性分析,并由此得出重金属污染物的传播特征;另一方面应用前面分析的结果,利用克里格法进行估值,并由此对其它未知点污染程度进行预测得出图形,并由此确定污染源(污染最严重的区域)。当然为了更好确定传播特征和污染源的位置,我们对各重金属元素和海拔的相关性分析,通过数据不难看出他们的传播特征在一定程度上也相似,但是也有些相关性相对较弱,如As和Cd,说明他们的传播特征有一定的区别。但总体上,重金属的含量之间都是正相关的,说明所有重金属的传播有一定的共同点。而所有重金属的含量与海拔之间都是负相关的,说明,随着海拔越低,他们的重金属含量越高,表明重金属的传播向下沉。
最后对所建模型进行评价和改进。
三、 模型的假设
1) 假设所有数据都是真实可靠的;
2) 假设污染源为重金属含量最高的地方; 3) 假设问题三中重金属含量是平稳的,即假设第三问中半方差函数的值只与距离
h有关,而与其他无关。
四、 符号说明
:在图中表示工业区;
:在图中表示生活区; :在图中表示交通区; :在图中表示山区; :在图中表示公园绿地区;
r(h):变异函数;
N(h):是分隔距离为h时的所有观测样本对总数;
Co:为块金常数;
C:为拱高;
3
a:为变程。
五、 模型建立与求解
(一)采样数据的预处理
(1)对异常数据的处理
异常数据值在第三问中对重金属污染的空间变异特性有很重要的影响,会影响变异函数理论模型的精度。我们采用统计中常用的3?原则,即以采用数据超出A?3S范围的为异常数据,其中A、S分别为采用数据中各重金属的样本均值和样本标准差。当采用数据大于A?3S时,以A?3S代替;当采用数据小于A?3S时,以A?3S代替。
(2)对采用数据的正态性检验
本文的第二问的各功能区重金属污染的单因子方差分析和第三问的重金属传播的空间变异特征的研究模型都是基于正态分布的,因此有必要对八种重金属元素污染的样本数据进行正态分布检验。本文采用的是利用SPSS软件的QQ图来检验他们是否服从正态分布(若样本数据基本近似于在一条直线上就服从正态分布),若不服从正态分布,则对试验数据进行对数转换,看是否服从正态分布。经过反复比较,本文八种重金属中,As直接符合正态分布,其它七种重金属Cd、Cr、Cu、Ni、Hg、Pb、Zn经对数转化后服从正态分布。它们的QQ-PLOT图如下:
As的正态检验QQ图1 Cd的正态检验QQ图2
4
Cr的正态检验QQ图3 Cu的正态检验QQ图4
Hg的正态检验QQ图5 Ni的正态检验QQ图6
Pb的正态检验QQ图7 Zn的正态检验QQ图8
(二)问题(1)模型的建立与求解
首先,根据附件一的样本,我们Matlab编程可以由此作出该城市城区的样本取样点图,并标出这些样本点所属的不能功能区(如图9)。为了标出重金属元素在该城区的空间分布,并在不同区域重金属的污染程度,现对这八种重金属的样本等分成5组,分别用不同的颜色标注它们的污染程度,具体如下。
5