ARIMA Theory(求和自回归移动平均模型理论)
求和自回归移动平均模型是简单AR(自回归)模型的推广,它用三种工具来模拟扰动项中的序列相关性。
第一个工具是运用自回归或AR项。上面介绍的AR(1)模型仅运用了一阶项,但是,总的来说,可以用更多的、高阶AR项。每一个AR项对应于无条件残差的预测方程中使用的残差滞后值。一个p阶自回归模型,AR(p)形式如下:
(20.14)ut??1ut?1??2ut?2?...??put?p??t
第二个工具是求和项。求和的阶相当于对预测序列进行差分。一阶求和表示预测模型对于最初序列进行一次差分。二阶求和相当于进行二次差分,等等。
第三个工具是运用MA、移动平均项。移动平均预测模型用预测误差的滞后值来改善当前预测。一阶移动平均项运用最近时刻的预测误差,二阶移动平均项运用最近两个时刻的预测误差,等等。MA(q)的形式如下:
(20.15) ut??t??1?t?1?...??q?t?q
自回归和移动平均表示可以组合为ARMA(p,q)模型:
(20.16) ut??1ut?1??2ut?2?...??put?p??t??1?t?1?...??q?t?q
虽然计量经济学家们常常对回归模型中的残差运用ARIMA模型,但这一表示可以直接用于一个序列。
后者提供了一种单变量模型,指定序列的条件均值为一个常数,并且用序列与均值的离差作为残差。
ARIMA模型原理(博克思-詹金斯1976) 在ARIMA模型的预测中,通过对上面描述的三个成分的有机组合构成一个完整的预测模型。对残差序列建立ARIMA模型的第一步是看看它的自相关特性。为此,可以看序列的相关图,正如Correlogram里大致描述的那样。
ARIMA建模的这个阶段叫做识别(不要和联立方程中相同的词混淆)。残差的现值与过去值之间的相关性为选择ARIMA模型提供指导。
自相关函数很容易解释---每一个自相关函数都是序列的现值与滞后几期值之间的相关系数。偏自相关函数有些复杂,他们用于衡量序列的现值和滞后值之间的相关性,又要先考虑所有的低阶滞后项对预测的影响。例如滞后6阶偏自相关函数,在预测模型已知
ut?1,ut?2,ut?3,ut?4,ut?5,可用来度量ut?6附加的预测能力。事实上,偏自相关函数,准确
地说,是ut?6在一个回归中的回归系数,这个回归中包含较早的滞后项作为ut的预测因子。 如果怀疑在因变量和一些其它预测因子之间有滞后分布关系,在估计之前可以看他们之间的互相关函数。
下一步是决定要用哪种ARIMA模型。如果自相关函数以几何速度平稳减少,并且滞后一阶之后偏自相关函数为0,此时用一阶自回归模型。另一个选择是,如果在一阶滞后项之后自相关系数为0,并且偏自相关函数呈几何减少,这种情况下用一阶移动平均模型。如果自相关系数呈现季节性,建议用季节性ARMA模型。
例如,我们可以检查DRI原理序列HS.WF1 workfile相关图,通过HS序列工具栏中选择View/Correlogram
具有季节性频率交织的周期相关图表明HS适合使用季节性ARMA模型。
ARIMA分析的目的是用一种简单的方式表示调节残差的过程。应使用适当的AR和MA模型作为拟合残差的工具。赤池信息准则和施瓦茨标准为每个估计提供适当滞后项选择指导。
在选择适当的ARIMA模型后,应该核实没有模型中没有计算在内的自相关函数。检查新息序列的自相关和偏自相关函数(ARIMA模型中的残差) ,看看是否有重要的预测项被忽视了。EViews为估计提供诊断检查。
ARIMA模型的估计
EViews估计一般ARIMA模型允许右边为解释变量。尽管这些模型有时被表示为ARIMAX形式,我们还是将这个广义的模型,称为ARIMA。
要表示ARIMA模型:
对因变量做差分,如果有必要,计算整合的阶数。
描述您的结构回归模型(因变量和回归子)并如上所述添加一定的AR或MA项,。
差分
d算子可以用于指定序列的差分。若要作一次差分,只需将序列名称填入d后括号中。例如,d(gdp)表示GDP的一次差分,或者GDP-GDP(-1)。
更复杂的形式的差分可以指定两个可选参数,n和s. d(x,n)表示序列X的n阶差分。 (20.17), d(x,n)?(1?L)nx,
L是滞后算子,例如d(gdp,2)表示GDP的二阶差分: d(gdp,2) = gdp - 2*gdp(-1) + gdp(-2)
d(x,n,s)表示X的滞后S阶季节差分的n阶普通差分: (20.18). d(x,n,s)?(1?L)n(1?Ls)x,
例如,d(gdp,0,4)表示0次差分与滞后四阶季节差分,或用GDP-GDP(-4)表示
如果您需要计算对数值,还可以使用dlog算子,它会返回差分的对数值。例如dlog(gdp)表示log(GDP)的一次差分,或者用log(GDP)-log(GDP(-1))表示。也可以用n,s 描述dlog(x,n,s)
在EViews里有两种方法可以用来估计积分模型。第一,可以用差分后的数据生成一个新的序列,然后用新的数据估计ARMA模型。例如,对M1估计Box-Jenkins ARIMA(1, 1, 1)模型,可以输入: series dm1 = d(m1)
equation eq1.ls dm1 c ar(1) ma(1)
另外,也可以将差分算子d直接放在放入估计表达式。例如,估计同一个ARIMA(1,1,1)模型可以输入命令:
equation eq1.ls d(m1) c ar(1) ma(1)
后一方法一般成为首选有一个重要原因。如果您定义一个新的变量,如上述DM1,并在您的估计程序里使用它,那么当您根据所估计的模型进行预测, EViews将预测被解释变量DM1。这就是说,你将会得到一个差分序列的预测。如果你真正感兴趣的是预测原始变量,在这个例子中, M1 ,你将不得不手工转换预测值,并调整计算相应的标准误差。此外,如果M1的任何其他变换或滞后项是回归元,EViews不会知道他们与DM1有关。但是,如果模型中使用差分算子表示因变量,d(m1),预测过程将提供预测原始变量的选择,如例子中对M1的预测。
差分算子也可用于用于指定外生变量以及没有ARMA项的方程。只需简单地将它们放在回归因子以及外生变量表中。例如:
d(cs,2) c d(gdp,2) d(gdp(-1),2) d(gdp(-2),2) time
这是一个有效的表式,在等式的左右两边都使用了差分算子。
ARMA项
模型的AR和MA部分将使用关键字ar和ma作为方程的一部分来表示。在上述的例子中我们已经见过AR项的表示,并且同样的想法也可以直接用于MA项。
例如,估计二阶自回归和一阶移动平均误差的ARMA(2,1)模型,表达式中应该包括AR(1),
AR(2), 和MA(1)项以及其他回归量 c gov ar(1) ar(2) ma(1)
重申一遍,不需要连续地使用AR和 MA序列。如果想拟合一个四阶自回归模型来考虑季节性变动,应该用AR(4)模型 c gov ar(4)
通过只使用MA项您也可以指定一个纯移动平均模型,因此: c gov ma(1) ma(2)
表示对残差建MA(2)模型
传统的博克斯一詹金斯或ARMA模型没有任何右边变量除了常数。在这种情况下,你的回归量除了AR 和 MA仅包含一个C。例如: c ar(1) ar(2) ma(1) ma(2)
这是一个标准的博克斯一詹金斯ARMA (2,2)模型
季节性ARMA项
博克斯一詹金斯(1976)建议使用季节性自回归(SAR)和季节性移动平均(SMA)项去估计月或季度数据有规律的季节性变化。p阶滞后季节性自回归项在方程中用SAR(p) 表示。在估计中使用的滞后多项式是一个AR项和一个SAR项的乘积。SAR的目的是允许你写成滞后多项式相乘的形式。
同样的,你的表示里可以包括SMA(q),用来表示q阶滞后季节性移动平均项。在估计式中的滞后多项式是MA项和SMA项的乘积。至于SAR,SMA序列允许构建一个由基本滞后多项式相乘的多项式。
例如,一个没有季节性的二阶AR过程如下所示: (20.19),ut??1ut?1??2ut?2??t
其可以被滞后算子L, Lnxt?xt?n表示成: (20.20).(1??1L??2L2)ut??t
可以通过在回归因子表中加入ar(1) 和 ar(2)来估计这一过程。季度数据中,您可能要添加sar(4)表达式来考虑季节因素的影响。如果您指定的方程为,
sales c inc ar(1) ar(2) sar(4)
则所估计的误差的结构为:
(20.21). (1??1L??2L)(1??L)ut??t
误差过程等价于:
(20.22).ut??1ut?1??2ut?2??ut?4???1ut?5???2ut?6??t
参数?是该季节性模型中的一部分,请注意,这是一个非线性系数约束的AR(6)模型。
24
正如另一个例子,一个没有季节性的二阶MA模型如下所示: (20.23),ut??t??1?t?1??2?t?2 或者用滞后算子表示为: (20.24). ut?(1??1L??2L2)?t
估计这个二阶模型时,在等式中包括MA(1) 和 MA(2) 项
对于季度数据中,您可能要添加sar(4)表达式去考虑到季节因素的影响。如果您指定的方程为,
cs c ad ma(1) ma(2) sma(4) 则所估计的模型为:
CSt??1??2ADt?ut
(20.25) ut?(1??1L??2L2)(1??L4)?t 误差项等于:
(20.26). ut??t??1?t?1??2?t?2???t?4??1??t?5??2??t?6
参数?是该季节性模型中的一部分。这是一个非线性限制系数的MA(6)序列。也可以在表达式中将SAR 和SMA项都包括在内
ARIMA估计的输出
含有AR 或 MA的估计式的输出与通常最小二乘法的输出一样,只不过在下方加了一块,用于显示AR 和 MA的多项式的逆根。如果我们将一般的ARMA模型用滞后多项式
?(L)和?(L)表示
(20.27),
?(L)ut??(L)?t
则所报告的根和根的多项式为: (20.28).
?(x?1)?0 ?(x?1)?0
根可能是虚根,应该有模不大于1 。如果任何一个根违反此条件,输出会显示一个警告信息。
如果?有一个实根其绝对值大于1或一对复逆根在单位圆外(即与模大于1 ) ,这意味着,自回归过程是发散的。
如果?有逆根在单位圆外,我们说MA模型不可逆,这使得解释和使用MA结果有困难。然而, 可逆性不是实质性的问题,汉密尔顿(1994a, p. 65))提到,MA模型始终有等价的表达式其逆根在单位圆内。相应地,应该用不同的初始值重新估算您的模型,直到得到满足可逆性的移动平均过程。另外,不妨关掉MA倒向预测功能。
如果所估计的MA过程的根模接近1,这是一个迹象,表明数据差分过度。该过程将是难以估计的而且更加难以预测。如果可能的话,您应该重新估计少做一轮差分。