时间序列ARMA模型在海表温度中的应用
作者
摘要:时间序列分析是概率统计学中应用性较强的一个分支,其在海表温度的预测等领域也有着广
泛应用。海表温度(SST)是海洋与大气之间相互作用的关键因素,本文在对海表温度SST分析的基础上,展示海表温度在一定时期内的变动过程,从中寻找和分析事物的变化特征、发展趋势和规律。获得海表温度随时间过程的演变特性与规律,进而预测海表温度的未来发展。本文在时间序列ARMA模型的基础上,利用AIC准则对模型进行定阶,并对时间序列随机项利用Daniel进行平稳性检验以及残差利用Ljung-Box检验进行白噪声检验。
关键词:海表温度;ARMA模型;AIC准则;Daniel检验;Ljung-Box检验 中图分类号: 文献标识码:A 文章编号:
1 引言
海表温度不仅是用于描述海洋表层热状况的主要指标,其异常还是海洋影响大气环流和气候变化的重要因子,在海气相互作用研究中,海表温度一直是人们观测、研究和预报的重要对象
[1]。海
洋约占地球表面积的70%,全球海洋吸收的太阳辐射量约占进入地球大气的总太阳辐射量的70%左右,对大部分存储在海洋表层。这些被存储的能量将以潜热、长波辐射和热交换的形式传输给大气,驱动大气运动。海洋热状况的变化将对大气运动的能量发生重要影响,从而引起全球气候和环境变化。由此可见,海洋是全球气候系统的组成部分,是调节和制约气候异常的重要因素
[2]。海表温度
是海洋的主要物理参数之一,在大气与海洋间热量、动量及水汽交换中扮演着重要角色。他是决定海气相互作用及气候变化的重要因素
[3]。海表温度数据已经被广泛的运用到多个海洋研究领域。例
[4]如,海表温度是控制生物种群分布、洄游和繁殖的基本量实际生活中有着极其重要的作用。
。因此海表温度数据集的研究、预测在
一个时间序列,展示了被研究对象在一段时间内发展变化过程。所谓时间序列方法,就是指在所研究对象的一组实测时间序列基础上,通过各种数学的分析处理手段,寻找序列变化特征、发展趋势与规律,进而对未来某时刻研究对象的状态作出估计。这样,就把影响研究对象的一切因素由“时间”综合起来描述了
[5]。ARMA模型理论已被证明是实现平稳时间序列建模的有效工具之一,
可用于谱估计、预测、控制、故障诊断等领域,具有广阔应用前景。滑动自回归(ARMA)模型不
1
仅与它以前时刻的响应有直接关系,而且还与它以前时刻的进入系统的扰动存在着一定的相关关系。这种模型与其他预测方法,具有以下特点:ARMA模型预测只考虑预测序列本身历史数据反映和包容的信息,几乎不直接考虑其他相关指标的信息;ARMA预测方法主要用于短期预测;由于ARMA预测模型不直接考虑其他相互因素的变动,预测方法比较简明,适合于指标数量不大但预测频度较高的预测工作[6]。
趋势性、周期性、突变性是时间序列的基本特征,同样海表温度SST也有其相应的性质。而在做ARMA模型前,我们需对时间序列判断并剔除趋势项、周期项,从而得出随机项。目前国内外对ARMA模型的研究已相对较为完整,因此,在ARMA模型的处理方法中比较具有针对性。在对随机项做ARMA模型,首先需要对其进行平稳性检验,通过平稳性检验的随机项才能够用来建立ARMA模型。本文给出了观察时序图、自相关图检验、单位根检验以及Daniel检验法四种方法,并Daniel检验法对本文中随机项序列进行平稳性检验;平稳性检验通过则进行下一步,否则进行差分处理非平稳随机序列,本文对各海域大量的时间序列集做一阶差分,发现所有不平稳随机序列在一阶差分后达到平稳;在ARMA模型中,本文主要考虑的是对模型进行定阶,模型定阶目前主要有三种方法:一、对于平稳序列的自相关函数及偏自相关函数具有很好的截尾性特征的模型,可根据其截尾点来定阶,而对于ARMA模型的ACF与PACF都具有拖尾性,此种方法并不适用。二、残差方差图定阶法只能给出模型定阶的一个粗略的判定,因此本文不作过多考虑。三、在日本学者赤池(Akaike)提出的AIC准则基础上,我们给定阶数的范围从中寻找最优阶数,此种方法精确度相对较高可行,被本文所采用[7];在ARMA模型阶数确定的基础上,本文求出残差,并利用Ljung-Box检验法对残差进行白噪声检验,证实模型的可靠性。
2 模型建立与分析
滑动自回归(ARMA)模型在预测模型着起着重要的作用,利用其对时间序列海表温度随机项进行定阶,从而进行短期预测,对于海表温度的分析以及海表温度测试的准确性等,具有重要的现实意义。
2.1 ARMA模型介绍
如果时间序列Xt是独立的,没有任何相关关系,这样的资料所揭示的统计规律是事物独立的随机变动,系统无记忆能力,对于这样的问题可用多元统计分析进行研究;而如果时间序列Xt之间有一定联系,我们需找出其运动规律,并根据这个规律建立模型,对系统未来的发展进行预测与控制。
而如果一个系统在时刻t的响应Xt不仅与它以前时刻t-1,t-2,??的响应Xt?1,Xt?2,??有直接关系,而且还与以前时刻t-1,t-2??进入系统的扰动?t?1,?t?2??存在一定的相关关系,那么此类系统为滑动自回归(ARMA)模型。数学模型如下:
2
?Xt??0??1Xt?1????pXt?p??t??1?t?1???q?t?q???p?0,?q?0 ?2?E(?t)?0,Var(?t)???,E(?t?s)?0,s?t?E(?X)?0,?s?tts?其中:Xt--随机过程 ?t--白噪声过程
特别的,当?0?0时,称为中心化ARMA(p,q)模型,引进延迟算子,则可记为:
?(B)Xt??(B)?t
其中,?(B)?1??1B??2B????pB为p阶自回归系数多项式 ?(B)?1??1B??2B????qB为q阶滑动平均系数多项式
因此,在平稳时间序列建立模型时,可先拟合一个ARMA(p,q)模型,然后根据其参数值
2q2p?1,?2,??p和?1,?2,??q是否显著为0这一信息来寻找较为合理的模型,再拟合相应模型检验其适
应性
[7]。
根据ARMA模型的性质,给出ARMA模型定阶的流程图,如图1:
3
给出时间序列 时间序列数据白噪声检验 Y N 判断趋势性 Y 剔除趋势项 N 判断周期性 Y 剔除周期项 N 得到随机项 平稳性检验 Y N 差分 利用AIC准则对ARMA模来定阶、同时求出残差 残差进行白噪声检验 Y 建模结束 N 模型重选
图1:ARMA模型定阶流程图
4
2.2 预处理及分析
在ARMA模型是定阶以及实现过程前,需对海表温度时间序列数据集进行处理。我们知道,时间序列具有加法模型[8]:
Xt?Mt?St?Yt
其中,Xt:原始数据项;Mt:趋势项;St:周期项(季节项);Yt:随机项。
因此,在进行ARMA模型定阶预测前,我们需对时间序列进行趋势项检验剔除以及周期项检验剔除。这里,对海表温度数据集趋势项、周期项的检验与剔除不一一详述。
2.3 白噪声检验 2.3.1 白噪声定义
时间序列Xt,如果是由一组不相关的随机变量序列构成,及对于所有s不等于t的随机变量Xt与Xs的协方差为0,则为随机过程。对于纯随机过程,若期望和方差均为常数,则称之为白噪声过程。数学模型如下:
如果序列?Xt?满足:E?Xt???,Var?Xt???,Cov?Xt,Xs??0,?t?s
2则称?Xt?为白噪声序列,记为Xt~WN?,??2?
因此,白噪声序列是一组完全无关的时间序列集。在对一组时间序列数据集进行白噪声检验通过时,说明这组序列没有规律,不需要建立任何模型。同时,值得注意,在对ARMA模型残差序列进行白噪声检验时,需通过白噪声检验,上文中ARMA模型定义中可以看出残差序列是白噪声过程。
2.3.2 Ljung-Box白噪声检验
白噪声是纯随机性序列,它具有性质?k?0,?k。因此可以通过检验下列假设来检验序列是否是白噪声:
H0:?1??2????m?0?H1:?k?m,使得?k?0记:
?k????n?k?t?t?k,k?1,2?,m
t2?t?1n?k???t?1其中,?t为残差,m为?t自相关函数的拖尾数。 则统计量为LB(Ljung-Box)统计量
??5