三、ARMA/ARIMA模型的建立
例1 给定时间序列{xt}如下表所示,试建立该时间序列的模型。
年份 储蓄 年份 储蓄 年份 储蓄 年份 储蓄 年份 储蓄 1950 83.5 1960 73.6 1970 83.5 1980 81 1990 89.6 1951 63.1 1961 78.8 1971 83.2 1981 82.2 1991 90.1 1952 71 1962 84.4 1972 82.2 1982 82.7 1992 88.2 1953 76.3 1963 84.1 1973 83.2 1983 82.3 1993 87 1954 70.5 1964 83.3 1974 83.5 1984 80.9 1994 87 1955 80.5 1965 83.1 1975 83.8 1985 80.3 1995 88.3 1956 73.6 1966 81.6 1976 84.5 1986 81.3 1996 87.8 1957 75.2 1967 81.4 1977 84.8 1987 81.6 1997 84.7 1958 69.1 1968 84 1978 83.9 1988 83.4 1998 80.2 1959 71.4 1969 82.9 1979 83.9 1989 88.2 建模步骤如下: (一)画时序图
打开序列窗口,在该窗口中做如下操作:
View/Graph
可得图3.1所示的窗口。
图3.1
11
然后在该窗口中的Graph type中进行选择:在General中选择Basic graph,在Specifi中选择line&symbol,其他选项如图3.1所示。选择完成后,确定即可得到图3.2。
CHUXU959085807570656050556065707580859095 图3.2
(二)相关性检查
打开序列窗口,在该窗口中做如下操作:
View/Correlogram
可得到图3.3:
图3.3
其中Correlogram of有三个选项:level表示对原序列的自相关性计算,1st difference和2st difference分别表示1阶以及2阶差分的自相关性的计算。一般默认项为level。
Lag to include处应定义计算自相关系数时的最大延迟阶数k,一般情况下,当样本量n较大时,k=[n/10],较小时取k=[n/4]。而当数据为周期数据时,k取周期长度的整数倍,如季度数据,k可以取4,8,12等。
点击ok,即可得到计算结果,如图3.4所示。
12
图3.4
图3.4包括两部分,左半部分是序列的自相关和偏自相关图,右半部分包括5列数据,第一列的自然数表示延迟阶数k,AC是自相关系数,PAC为偏自相关系数,Q-Stat表示对序列进行相关性检验的Q统计量值,Prob表示其P值,即相伴概率。当P<0.05时,表示拒绝原假设,即序列相关,否则,当P>0.05时,序列不相关。
本例中所有的P<0.05,表明序列相关。 (三)平稳性
方法1通过序列的时序图判断
根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及周期特征。
由序列的时序图可见序列没有明显的趋势和周期变化,初步判定序列平稳。 方法2通过自相关图判断
如果序列的自相关系数很快地(滞后或延迟阶数k大于2或3时)趋于0,即落入随机区间,则序列平稳,反之非平稳。
由自相关图可见序列平稳。 方法3单位根检验(单侧检验)
在序列对象窗口进行如下操作:
View/Unit Root Test
13
可得到图3.5。
图3.5
窗口有几个需要进行选择的部分,第一个是Test type,共有6种单位根检验凡是可供选择,选择Augmented Dickey-Fuller;第二个是Test for unit root in,其中的三个选项分别表示对原序列,一阶差分序列和二阶差分序列进行单位根检验;第三个Include in test equation中也有三个选项,表示可用于的三种序列的单位根检验:Intercept表示有常数均值,无趋势的p阶自回归过程,Trend and intercept表示有常数均值,有趋势的p阶自回归过程,None表示无常数均值,无趋势的p阶自回归过程;Lag length包括Automatic selection和User specified两部分,两者只能选择一个来定义。若选择Automatic selection,系统默认Schwarz Info Criterion,Maximum lags中,系统自动计算其值,若选择User specified,则要填写数值,一般,可以通过公式计算
12(T/100)1/4
其中[X]表示不超过X的最大整数部分,T为样本观察值的个数。
选择好各选项之后,点击OK,即可得图3.6所示的结果:
14
图3.6
由图3.6可见,检验t统计量的值为-3.000420,显著性水平1%、5%、10%的临界值分别为-2.615093、-1.9947975、-1.612408,可见t统计量的值小于各显著性水平的临界值,故拒绝原假设,认为序列平稳。 (四)模型识别
根据图3.4可见自相关系数拖尾,偏自相关系数1阶截尾,所以采用AR(1)模型。
(五)参数估计
有2种操作方法进行参数估计。 方法1 命令方式 在主窗口输入命令:
ls chuxu c ar(1)
回车后可得图3.7所示的窗口。窗口的上半部分为参数估计结果,其中第1列分别为解释变量名(包括常数项),第2列为相应的参数估计值,第3列为参数的标准误差,第4列为t统计值,第5列为t检验的双侧概率值p,即P(| t |> ti)= p。方程窗口的下半部分主要是一些统计检验值,其中各统计量的含义如表3.1所示。图3.7中最下方给出的是Φ(x)=0的根的倒数,当这些值都在单位圆内时,过程平稳。(当为MA模型时,此处为Θ(x)=0的根的倒数,为ARMA时,此处分别为Φ(x)=0及Θ(x)=0的根的倒数。)此处特征根为0.7,所以过程平稳。
15