综述指示克里格方法的原理与应用
学号:2013301610318 姓名:
在土壤质量评价、大气污染物浓度分布评估等研究中,克里格空间插值方法
是一个有力的工具。但是观测数据中往往存在一些特异值,观测数据不成(对数)正态分布,影响了变异函数的稳健性。如果用参数地质统计学方法, 则必须剔除这些特异值或者对观测值进行非线性转换,以使观测值的概率分布满足正态,但这会影响变量空间变异的真实信息。非参数地质统计学中的指示克里格法是处理有偏数据的有效方法,它能在不必去除重要而实际存在的特异值的条件下处理不同的现象,并能抑制特异值对变异函数的稳健型的影响。指示克立格法是一种最常用的非参数地质统计学方法,它是因把对区域化变量的研究转换为对其指示函数的研究而得名.有关指示克里格方法的研究与应用,国内外学者已经做了很多工作,但是大部分研究都是单元指示克里格在单一尺度下的应用。本文将主要讨论指示克里格方法的基本原理,指示克里格的应用方法(比如多尺度指示克里格、多元指示克里格等)以及指示克里格法的限制和不足。
1 基本原理
克里格(Kriging)插值法是空间统计分析方法的重要内容之一,它是建立在
半变异函数理论分析基础上的,是对有限区域内的区域化变量取值进行无偏最优估计的一种方法。基于这种方法进行插值时,不仅考虑了待预测点与邻近样点数据的空间距离关系,还考虑了各参与预测的样点之间的位置关系,充分利用了各样点数据的空间分布结构特征,使其估计结果比传统方法更精确,更符合实际,更有效避免了系统误差的出现。
在空间统计分析方法中,可以通过选择阈值,将一个连续的变量转换成一个
值为0或1的二进制变量。比如在研究区域D内,Z(X)表示采样点X上的采样值,设Z为研究区域D上的一个临界值(阈值),则在D上的每点X∈D上定义一个Z 的指示函数如下:
1
?? ??;?? =
1 ??(??)≤?? 0 ?? ?? >??
对于指示函数?? ??;?? ,可以用条件概率来描述:当Xa, a=1,2,?,n为采样点时,
I ????;Z =P{Z(????)≤Z|Z ???? =????} 这时,某待估点X的指示函数估计值???(??;??)可以表示为:
??? ??;?? =??{??(??)≤??|?? ???? =???? ,??=1,2,?,??}
对于采样点来说,指示值可解释为已知该点的实测值为Za时,该点的真实值小于等于阈值的概率,而对于待估点,其指示函数估计值可解释为已知待估点周围信息(样本的实测值) 时,该点的真实值小于等于阈值的概率。
克里格插值法的研究工具是半变异函数,指示克里格插值法的研究工具是指
1
γ ? =??{[?? ??;?? ???(??+?;??)]2}
2在实际应用中,半变异函数可由下式(实验半变异函数)进行计算
1
γ(h)= [?? ????;?? ???(????+?;??)]2
??(?)??=1??(?)
示半变异函数γ ? :
其中,??(?)表示分隔距离为?的样本对的数量。半变异函数是在假设Z(X)为
区域化变量且满足平稳条件和本证假设的前提下定义的。数学上可以证明,半变异函数越大,空间相关性越弱。
使用指示值,通过实验半变异函数进行半变异函数的模拟计算,并使用半变
异函数的理论模型进行拟合,拟合得到最佳的半变异函数模型。常用的半变异函数的理论模型包括球面模型、高斯模型和线性有基台模型。在已知采样点数据值的情况下,根据最佳半变异函数模型,使用普通克里格插值方法可以计算出待估点的数据值在给定阈值下对应的指示值(即条件概率),最后就能得到整个研究区域的相对于某一阈值的概率空间分布图。
2 应用方法
若在指示克里格应用的各个步骤中采用不同的方法,就产生不同的指示克里格方法。根据采样尺度的不同,指示克里格可以分为单一尺度指示克里格和多尺度指示克里格;根据研究变量的数目,可以分为单元指示克里格和多元指示克里
2
格;根据设置的阈值的数目,可以分为单指示克里格和多指示克里格。以下将分别介绍单一尺度单元指示克里格、多尺度指示克里格、多元指示克里格和多克里格法。
2.1单一尺度单元指示克里格
本文以土壤盐分空间分布的研究为例,介绍单一尺度单元指示克里格方法的应用。步骤如下。
1)分析研究区域概况。在研究土壤成分(如盐分、重金属等)分布时,要获
得研究区域的位置、气候、地形地貌以及其他影响研究对象分布的信息。
2)采样。根据采样区域的位置和大小,可以使用GIS技术将研究区域划分成均匀的格网,获取格网中心的坐标作为准采样位置,利用GPS进行野外采样导航。实际采样过程中有些采样点落在村庄、河流、道路等位置,就要在附近进行调整,并使用GPS记录下采样点的实际位置坐标,如不能采样,则将该采样点删除。
3)土壤样品的测定。将土壤样品带回实验室,使用正确的方法测定土壤中盐分的含量。
4)数据处理与分析。首先根据问题的要求确定评价指标的阈值,原则上阈值是可以任选的,可以是一个临界值,也可以是一个区间范围;然后,未评价指标确定指示函数,根据指示函数将相应的采样点数据进行二进制指示变换,得到各个采样点的指示值(0或1),指示值可以用来评价采样点上的土壤盐分的高低状况;然后,利用指示值进行变异函数的模拟计算,拟合得到最佳半变异函数模型;最后,利用拟合得到的半变异函数模型和普通克里格插值,得到土壤盐分相对于某一阈值的概率空间分布图。 2.2多尺度指示克里格
上文介绍了单元指示克里格法在单一采样尺度下的应用,但是土壤的空间特
异性是尺度的函数,即在不同尺度下,同一变量的自相关程度相差很大,且随着样点间的距离而增加,变异函数值的随机成分也在增加,更小尺度下的结构特征被掩盖,不利于深入分析土壤空间变异的结构特征,但是在多尺度下进行分析可
3
以解决此问题。
多尺度指示克里格就是在多个采样尺度下运用指示克里格法对土壤盐分的空间异质性进行分析。该方法与单一尺度的指示克里格方法相比,重点的是如何选择多个不同的尺度,既能反映研究区域整体的分布特征,又能揭示小尺度上的结构特征。
在不同的采样尺度上,可以分别运用单一尺度指示克里格方法进行采样和数据分析。参考文献研究表明,随着研究尺度的增大,地形、母质、土壤类型等大尺度结构因素对土壤性质的影响逐渐增强,而随机因素影响逐渐减弱,从而使土壤盐分的块基比变小、变程明显增加。当然,不同的研究对象会有不同的分布状态,也受研究区域具体情况影响,所以针对不同的具体问题可能会有不同结论。 2.3 多元指示克里格
多元指示克里格法(MVIK, Multiple Variable Indicator Kriging)是美国
农业部和华盛顿州立大学的研究者提出的。多元指示克里格法是将多个土壤性质指标综合成一个总体的土壤质量指数,即通过多变量指标转换(MVIT)将测定值进行转换,建立整体的土壤质量指数。其步骤如下:
1)分析研究区域概况。 2)对不同的变量进行采样。
3)对不同的变量设置不同的阈值,并进行指示变换。按照一定的规则,根
据多个变量对应的指示值求出综合指标的指示值。规则的选择要根据实际情况确定。比如在黄河三角洲地区的地下水与土壤盐分空间分布分析中,当不同的指示值都为1时,综合指标为1,否则为0。
4)计算综合指标的指示半变异函数,进行普通克里格插值,得到综合指标的概率分布图。
区域土壤资源利用风险的评价指标不仅有地下水性质和土壤盐分,还包括重金属含量、各种养分的含量等,各个指标之间可能相关,也可能相互独立,可能是水土资源的内在特性,也可能是外界赋予的属性。多元指示克里格法允许同时1这些因素,绘制出综合指标的概率分布图,可以为土壤或其他资源环境区域的合理化管理决策提供有力的证据,为综合、全面的评价土壤及其他资源的质量提
4
供了有效的方法。 2.4多指示克里格
多指示克里格(Multiple Indicator Kriging)是一个非线性非参数插值方法,常用于矿区勘探、矿石储量评估问题,可以根据部分钻孔采样值估算出某块体的矿石品位(矿石或产品中所含有用成分(元素或化合物)的百分含量)高于某阈值的概率分布。
多指示克里格基于指示函数,对于一个特定的阈值,我们可以计算出某一点的估计值大于(或小于等于)该阈值的概率。多指示克里格对指示函数设置了多个阈值,因此可以估算出估计值在不同范围的概率分布。
比如,在评估某矿石块体的矿石品位的应用中,设定一系列的阈值非常重要,可以根据最低工业品位和边界品位来确定阈值,其主要的目的是能够有效地区分矿石和废石。如果研究的问题没有实际意义的阈值,可以把采样值按大小顺序平均分成若干份,每相邻两份的中间值可以设为阈值。比如分成11份,就有10个阈值,然后分别对10个阈值分别进行指示克里格分析,就能得到研究区域在11个数值区间的概率分布。
如果某一数值范围更能反映研究对象的特征或对某一数值范围内的准确估计更重要,可以在这一范围内设置更多的阈值。比如在贵重金属分布研究中,由于大部分金属都包含在占小比例的高品位的矿石中,所以用指示克里格法估计高阈值区间的概率分布更加重要。
3 限制和不足
尽管指示克里格法有着广泛的应用,指示克里格法在局部估计中仍然有一些
限制和不足:
1)由于阈值接近采样值,当待估点的位置接近采样点时,估计的精度会比
较低。
2)对于一个由一些原始采样值得到的局部分布,当增加一个样本时,其数
值会发生较大的改变。也就是说,估计结果不是很稳定。
3)传统上对于上尾部数据的后处理的外插可能产生偏差。
5