?k2???LB?n(n?2)?k?1??n?k??
??m在原假设成立的条件下,LB近似服从自由度为m-r的卡方分布?(m?r),其中r是估计的模型参数个数,因此LB????m?r?时拒绝原假设。
22
2.3 平稳性检验 2.3.1 平稳性定义
这里的平稳指宽平稳。即如果序列?Xt?满足下列条件,则称为是平稳的: 1.E?Xt???,?t 2.Var?Xt???2,?t
3.Cov?Xt,Xs??Cov?Xt?k,Xs?k?,?s,t,k
2.3.1 平稳性检验
平稳性检验的方法很多,本文给出四种平稳性检验的方法,并使用Daniel检验法通过软件MATLAB来实现。 方法一:观察时序图
根据平稳性的定义,平稳序列具有常数均值和常数方差的性质,因此其时序图应该在一个常数值附近波动,且波动的范围有界;具有明显趋势性和周期性的序列通常不是平稳序列。
方法二:自相关图检验
平稳序列通常只具有短期的自相关,即自相关函数(ACF) 往往很快的衰减到零。因此衰减很慢的序列很可能是非平稳的。
方法三:单位根检验(ADF检验)
ADF检验,在一定的显著性水平下。接受存在一个单位根的原假设,则说明序列是非平稳的。 对于AR(p)过程,如果其特征方程的所有特征根都在单位圆内,则序列?xt?平稳,如果有一个特征根存在且为1,则序列非平稳,且自回归系数之和恰好等于1。证明如下:
???1?如下假设检验:
pp?1?L??p?0?1??1?L??p?0??1??2?L??p?1
??1因此,对于AR(p)过程我们可以通过检验自回归系数之和是否等于1来检验序列的平稳性。作
H0:??0?H1:??0 ???1??2?L??p-1
6
ADF检验统计量:??????为参数?的样本标准差。 ,其中S????S??ADF检验有三种类型,分别为: 无常数均值、无趋势的p阶自回归过程:
xt??1xt?1???pxt?p??t
有常数均值、无趋势的p阶自回归过程:
xt????1xt?1???pxt?p??t
有常数均值、有线性趋势的p阶自回归过程:
xt????t??1xt?1???pxt?p??t
方法四:Daniel检验
这里着重强调Daniel检验法。Daniel检验法建立在Spearman相关系数的基础上。Spearman相关系数是一种秩相关系数。样本秩的概念如下:
设x1,x2?xn是从一元总体抽取的容量为n的样本,其顺序统计量x(1),x(2)?x(n)。若
x(i)?x(k),则称k是x(i)在样本中的秩,记为Ri,对每一个i=1,2,??,n。称Ri是第i个秩统计
量。R1,R2,?Rn总称为秩统计量。例如,对样本数据
-0.8,-3.1,1.1,-5.2,4.2
顺序统计量
-5.2,-3.1,-0.8,1.1,4.2
则秩统计量
3,2,4,1,5
对时间序列的样本X1,X2?Xn,记Xt的秩为Rt?R(Xt),考虑变量对(t,Rt),t=1,2,?,n的Spearman的相关系数qs,有
qs?1?构造统计量
6n(n2(t?R)??1)ti?1n2
T?作如下假设检验
qsn?21?q2s服从自由度n-2的t分布
H0:序列Xt平稳,H1:序列Xt非平稳
7
Daniel检验方法:对于显著水平?,若T?t?(n?2),则拒绝H0,认为序列非平稳。当qs?0时,
2序列有上升趋势,而当qs?0时,序列有下降趋势;T?t?(n?2)时,接受H0,认为序列平稳。
22.4 差分
差分是通过逐项相减消除前后期数据相关性的方法,可继续剔除序列中的一些趋势性,是非平稳序列的均值平稳化处理常用方法。差分运算可用后移算法B或差分因子?以及相应阶数d表示。
1阶差分?Xt?Xt?Xt?1?(1?B)Xt
2阶差分?Xt?Xt?2Xt?1?Xt?2?(1?B)Xt ??
d阶差分?Xt?(1?B)Xt
其中,??(1?B)?1?CdB?CdB???(?1)dd122d?1dd22Bd?1?(?1)dBd为d阶差分算子。
差分后序列可将非平稳序列转化为稳定在常数附近的平稳序列,对差分后的序列拟合ARMA模型进行分析与预测。本文对各个海域海表温度的数据测试时,剔除趋势项与周期项后的个别不平稳序列的随机项进行一阶差分,发现全部平稳。因此,这里我们认为对海表温度数据集随机项进行一阶差分后,可满足平稳性要求,因此可以用来ARMA模型拟合预测。
2.5 ARMA模型定阶
对于平稳序列的自相关函数及偏自相关函数一般具有比较规范的统计特征。对于单纯的AR模型(MA模型),可根据偏相关PACF的截尾性来判定(根据自相关ACF的截尾性)。而对于ARMA模型的ACF与PACF都具有拖尾性,所以通过ACF与PACF的统计特征并不能很好的给ARMA模型定阶。
而残差方差图定阶法[7]只能给出模型定阶的一个粗略的判定,所以本文给出最佳准则函数的定阶法。该函数既考虑了模型的拟合时对原始数据的接近程度,又考虑了模型中所含待定参数个数最简略,建模时按准则函数取值的确定模型的优劣,使准则函数达到极小的就是最佳模型。
日本学者赤池(Akaike)提出了AIC准则[7],其指导思想:一方面是衡量拟合程度的似然函数值;另一方面是模型中未知参数个数。通常似然函数值越大、未知参数个数越多模型拟合精度越高,但又不能单纯的以拟合精度来衡量模型好坏,这样势必会导致未知参数个数较多。因此一个好的模型应该是一个拟合精度和未知参数个数综合最优配置,AIC准则在此考虑下提出,是拟合精度与参数个数的加权函数。ARMA模型的AIC函数如下:
AIC(p,q,?)?Nln??(p,q,?)?2(p?q?2)
其中,??(p,q,?)是残差方差;?是序列均值的待估参数。
8
?2?2因此,选取不同的p、q对时间序列进行拟合,计算相应AIC值,使其达到极小值的模型为最佳模型。选定最佳p、q后,计算模型残差,用来白噪声检验,以检验模型是否适合。
3 模型实现
基于上文提出的模型定阶以及检验等思想。我们通过软件MATLAB作如下实现: 输入:海域海表温度SST数据随机项 输出:ARMA模型阶数与检验是否通过
%随机项平稳性检验----Daniel检验 n=length(suiji); [xsort,ind]=sort(suiji);%随机项从小到大排序 Rt(ind)=1:n; %计算秩 t=1:n; Qs= 1-6/(n*(n^2-1))*sum((t-Rt).^2); t=Qs*sqrt(n-2)/sqrt(1-Qs^2); %t统计量 t_0=tinv(0.975,n-2); %计算分位点 如果abs(t)>t_0,则序列平稳 否则不平稳,需对序列进行一阶差分 %随机项不平稳----一阶差分 Suiji=diff(suiji) %ARMA模型定阶 这里限定p、q限制在12内 for p = 0:12 for q = 0:12 m = armax(u,[p q]);%用ARMA模型拟合 AIC(p+1,q+1)= aic(m);%用aic准则定阶 end end %求aic最小时的阶数 [m,n]=min(AIC); [a b]=min(m); q=n(b)-1; p=b-1; 输出p、q %残差分析----Ljung-Box白噪声检验 m=armax(u,[p q])%最优ARMA模型 e=resid(m,u)%计算此时下的残差 BZ=lbqtest(e)%白噪声检验
9
4 结果分析
本文通过对ARMA模型研究的基础上,利用AIC准则,并利用Daniel检验法检验平稳性并处理不平稳时使用一阶差分使其平稳,同时使用Ljung-Box检验法对残差进行白噪声检验,一旦白噪声检验通过,及残差序列是白噪声,我们认为模型拟合效果较好,ARMA模型可用。本文在各海域海表温度的基础上,通过测试验证模型拟合效果,结果如下:
东海测试结果: 测试数据序号 1 2 3 4 5 6 7 8 9 10 趋势性检验 0(无) 1 1 1 1 1 0 1 1 1 随机项平稳性检验 0(不平稳) 1 1 1 1 1 0 1 1 1 阶数p、q 1、1 5、5 8、7 8、7 9、5 9、5 1、1 4、4 8、8 8、6 残差白噪声检验 0(白噪声) 0 0 0 0 0 0 0 0 0
南海测试结果: 测试数据序号 1 2 3 4 5 6 7 8 9 10
10
趋势性检验 1 1 1 1 1 1 1 1 1 1 随机项平稳性检验 1 1 1 0 1 1 1 1 0 1 阶数p、q 8、2 2、10 4、1 7、9 10、12 10、12 7、8 11、7 9、3 7、11 残差白噪声检验 0 0 0 0 0 0 0 0 0 0