如抽取了12个样,N—2=10,r=0.612。查表可知,| r |≥0.576,| r |<0.708,可以说在α=0.05水平上是显著的,而在α=0.01水平上是不显著的。
经过显著性检验以后,所建立的回归方程虽然是有价值的,若用以预报外推涌水量或水位降深,仍然可能存在一定的误差,还需要研究预报的精度问题。
各实际观测值与回归方程计算值的误差称为剩余标准差,
以δS表示,用下式计算:
式中:Si为实际观测值,S?为对应在回归方程上的计算值。 剩余标准差的大小,反映了各实测点偏离回归方程的程度,可以用来说明用此回归方程外推预报的精度。δS愈小,
则预报精度愈高。
根据概率论中随机变量成正态分布的理论可知,在Si的全部观测值中,有68.3%都可能落在回归直线两旁各一个剩余标准差的范围内,即任一观测值Si可能落在S???i之间的
95.4%
概率P=68.3%,或用下式表示(图10一9):
例如,当我们计算得知δi=0.5m,用回归方程预报Qi=23104m3/a时,S?=10m,则S=10±0.5m的精度只有68.3%的把握;而S=10±1.0m的精度则有95.4%的把握;若预报S=10±1.5m的精度则几乎有百分之百(99.7%)的把握。
要提高预报的精度及预报的把握性,只有提高观测的精度,尽量减少人为误差,观测数据要多,自变量的取值范围要大,相关系数要大。
以上以 S与 Q之间的关系为例,讨论了一元线性回归方程的建立,显著性检验及预报精度,同样可以分析其他量(如降水量与允许开采量或泉流量)之间的相关关系。 (2)非线性回归(曲线回归)
若实际观测值在散点图上没有直线的趋势,而呈近似的曲线趋势时,则可用上述相同的方法建立一个曲线回归方程。不过,首先要用变量替换的方法,把曲线方程变为直线方程(即线性化),然后利用前述的一元线性回归的方法进行求解。即
曲线方程→变量替换→将曲线方程化为直线方程→通过线性回归得线性回归方程→变量回代→还原为曲线方程。 例如,幂函数有满足多种曲线的性质,其一般式为:y=b ax
式中:a,b为待定系数。若两边取对数则变为:
lgy?lga?blgx
令Y=lgy,A=lga,B=b,X=lgx,得直线方程:
Y=A+BX
下面用例子来说明一元线性回归方法评价可开采量的方法步骤:
实例:某水源地已有多年开采历史资料,经过条件分析,认为扩大开采后仍有补给保证。为了满足扩大开采,要求外推设计降深26m时的开采量。
解:首先,据历史资料绘成Q—S坐标的散点图,以便选择用直线或曲线回归方程。
按直线相关计算。原始资料和计算结果均列于表10—9中。计算步骤如下:
(1)计算基本数据:算出均值Q和S,再计算Qi?Q和
(Qi?Q),Si?S和(Si?S)及(Qi?Q)?(Si?S)。 (2)求根方差及均方根差:
22
(3)求相关系数:
(4)进行显著性检验:令N=6,则N—2=4,查检验表,当α=0.01时,相关系数达到显著的最小值,为0.917,这里0.996>0.917,故可认为这里开采量与降深的关系是密切的(显著相关)。另外,按一般供水要求,r>0.8,也是符合要求的,因此可以建立回归方程。 (5)求回归系数,建立直线回归方程:
回归方程为:
(6)求剩余标准差,确定预报精度:
(7)进行外推预报
用所建直线回归方程预报地下水的开采量,外推设计降深
为26m时的开采量,计算结果如表10一11所示。
2.多元回归
实际上影响地下水水位下降的因素往往不只一个,而是多个独立自变量的同时影响。因此,需要用多元回归方程来进行外推预报。多元回归的基本原理与建立一元回归方程大体相同,但计算上却要复杂一些。由于可运用电子计算机,许多复杂的计算都可以很快完成。 (1)二元直线回归方程
回归方程的一般形式为:
式中,a,b1,b2为待定系数,x1,x2为两个相互独立的自变量,这里指影响地下水位的因素,例如开采量、降雨量、回灌量等。
同样可用最小二乘法的原理,求出各待定系数,其公式为: 式中:
,x,x分别表示各自的均值。 其计算步骤与一元回归相同。 (2)二元曲线回归方程
y12也是将其线性化以后按线性方程计算。例如,二元幂曲线的一般式为: 两边取对数则变为: 令
则得
便可接直线二元回归方程计算。 (3)多元回归方程
当更多自变量影响时,可以用一般的多元线性回归方程: 同样,用最小二乘法原理可以求出各个待定系数,即回归系数。解多维联立线性方程组时,必须用电子计算机计算,有关书中均有专门程序可用。 3.逐步回归
若采用逐步回归的计算方法,还可以进行因子“贡献”大小的挑选,剔除“贡献”小的因素,最后得到主要影响因素的回归方程。曾有人将这种方法用于地下水动态预报中,取得较好的效果。
4.相关外推法的特点及适用条件
相关分析法是建立在数理统计理论的基础上的,考虑了一些随机因素的影响,便于解决一些复杂条件的水文地质问题。在数据采样时,应注意资料来源的一致性。它是根据现实物理背景下得出的统计规律,在此基础上适当外推是可以的,但外推范围不能太大。
这种方法适用于稳定型或调节型开采动态,或补给有余的旧水源地扩大开采时的地下水资源评价。如果已经是消耗型水源地,要用人工调蓄、节制开采来保护水源地。这时,也可以用相关分析法分析开采量、回灌量与水位的关系,求得合理的开采量和人工回灌量。上海市在控制地面沉降时曾作过这样的分析。