由于数据有缓慢的上升趋势,可以试用回归直线表示趋势项,这时认为?x,t?满足一元线性回归模型
xt?a?bt??t, t?1,2,.. .定义
X??x1,x2,...,x24?1Y???112......?T,1? ?24??a,b?T的最小二乘估计由公式
?????a,b??YY??T?T??1YX
决定,经过计算得到
??a?5780.1, b?21.9
回归方程为:
xt?5780.1?21.9t
这时,趋势项?Tt?的估计值是回归直线(见图6.4.4)。
?Tt?5780.1?21.9t (6.4.8)
图6-4-4 数据和直线趋势项
???利用原始数据?xt?减去趋势项的估计?Tt?后得到的数据基本只含有季节项和随机项,仍可
??以用第k季度的平均值作为季节项S?k?的估计。利用方法1中的公式(6.4.7)计算出
S?1??1037.2,S?2???393.4,S?3???1155.0,S?4??511.2.
????这时,?S?j??0。
j?14???????最后,利用原始数据?xt?减去趋势项的估计?Tt?和季节项的估计?St?后得到的数据就
???????是随机项的估计Rt?xt?Tt?St,1?t?24,见图6-4-5。
图6-4-5 季节项和随机项
为得到1997年的预报值,可以利用公式
X?24?k|24??T?24?k??S?k?, k?1,2,3,4. (6.4.9) 这里, X?24?k|24?是用例6.12中的24个观测数据对第24?k个数据的预测值。经过计算得到1997年的预测值为:
0预测值 7364.4 5955.7 5215.9 6904.
????真 值 7720.5 5973.3 5304.4 7075. 1.0434 ?17.6334 ?88.4634 ?171.0984 预测误差 ?356方法3 二次曲线趋势
我们还可以用二次曲线来拟合例6.12中数据的趋势项,这时认为?xt,t?满足二元线性回归模型:
xt?a?bt?ct??t,t?1,2,...
2定义
?1T?X??x1,x2,...,x24?,Y?1???11222.........1??24 ?224???a,b,c?T?????的最小二乘估计由公式?a,b,c??YY??T?T??1YX
???决定,经计算得到a?5948.5, b??17.0, c?16.0
这时,趋势项?Tt?的估计值是二次曲线(见图6-4-6)Tt?5948.5?17.0t?16t。
2?
图6-4-6 数据和二次趋势项
???利用原始数据?xt?减去趋势项的估计?Tt?,得到的数据基本只含有季节项和随机项,
??再用第k项季度的平均值作为季节项S?k?的估计,利用公式(6.4.7)计算出
S?1??1035.7,S?2???391.18,S?3???1153.5,S?4??509.6
????季节项的估计数据见图6-4-7。
4这时,
?j?1??????从原始数据?xt?减去趋势项的估计?Tt?和季节项的估计?St?S?j??0.62,
????后得到的数据就是随机项的估计
???Rt?xt?Tt?St, 1?t?24
最后利用公式(6.4.9)计算出1997年的预测值如下:
6 1 66. 1 5 4 6 9. 8 7 2 0 1. 4预测值 7531. 3真值 7720.5 5973.3 5304.4 7075. 1预测误差 ?189.2 192.7 165.4 126.3
图6-4-7 季节项和随机项
可以看出,利用二次曲线的方法3得出的1997年的预测值在总体上好于方法2得到的预测值.对更复杂的数据还可以用更高阶多项式或其他曲线拟合趋势项.
方法4 逐步平均法
拟合趋势项还有常用的逐步运动平均法,回忆样本数据的季节项有明显的周期s?4。对观测样本做逐步平均如下:
U2.5?143?xj?01?j, U3.5?143?xj?02?j,…,U22.5?143?xj?021?j
其中U的下标是相应的求和项中x的下标的平均。这个数据是趋势项的拟合。但是时间的指标不在整数位上,为克服这个不足,可以再取
?T3?12?U2.5?U?T22.5,4??12?U3.5?U4.5?,T22??12?U21.5?U22.5?
注6.1 当数据季节项的周期是奇数时,时间指标在整数位上,上述步骤就没有必要了。 这种方法的缺点是,在t?1,2和t?23,24处无法拟合出趋势项。
???利用原始数据?xt?减去趋势项的估计?Tt?得到的数据基本只含有季节项和随机项。仍
??然用第k季度的平均值作为季节项S?k?的估计。但是由于缺少t?1,2和t?23,24处的趋势
项值,只能用公式
???1S?k????xj,k?Tj,k??5j?2??5??16?????xk?4j?Tk?4j?
?j?1??????xk?4j?Tk?4j?,
?j?0?45???1和 S?k????xj,k?Tj,k??5j?1??515进行计算,经计算得到:
S?1??1036.7,S?2???367.5,S?3???1151.4,S?4??505.5
????这时?S?j??23.3。
j?14???????最后,从数据?xt?减去趋势项的估计?Tt?和季节项的估计?St?后得到的数据就是随机
????项的估计。为得到1997年的预测值,还需要对趋势项进行直线拟合,得到趋势项的回归直线
?Tt?5665.3?30.2t.
于是,由
X?24?k24??T?24?k??S?k?, k?1,2,3,4
???计算得到1997年的预测值为:
5 3 2 9. 1 7 0 1 6. 1预测值 7456.8 6082. 8预测误差 ?263.6975 109.4307 24.7217 ?59.0035
注6.2在以上的四种方法中,为了得到更好的趋势项,还可以利用数据重新估计趋势项
Tt,得到趋势项的新估计Tt,最后得到随机项。
? 方法5 回归方法
??对于时间序列观测样本Rt?xt?St?Tt,如果只为了预测的目的还可以用多元回归的方法。假设例1.2中的数据满足多元线性回归模型:
xt?b?b0t?b1d1,t?b2d2,t?b3d3,t?b4d4,t??t, t?1,2,...,24, (6.4.10)
?其中b,b0,b1,...,b4是待估计的常数, dk,t是哑元,满足
?1,t?k?4?j?1?是第k季度时间指标dk,t??其他?0,,1?j?6
模型式(6.4.10)的设计使得第k季度的数据有相同的斜率bk。由于模型式(6.4.10)中的参数过多,使得设计矩阵不满秩,为了克服这个问题,取b?0,得到下面的模型
. (6.4.11) xt?b0t?b1d1,t?b2d2,t?b3d3,t?b4d4,t??t,t?1,2,...
定义
?1?1?Y??0?0???020100300104000151000...............23001024??0?0? 0??1??则?b0,b1,...,b4?的最小二乘估计为
T??????b0,b1,...,b4??YY??T?T??1YX
经计算得到回归方程:
xt?28.1t?6748.4d1,t?5311.6d2,t?4543.6d3,t?6203.6d4,t
于是可以计算1997年的预测值为:
预测值 7452.2 6043.4 5247.4 6907. 3预测误差 ?268.3014 70.1086 ?57.0200 ?167.8043
在实际问题中,有时需要对时间序列的数据先进行适当的函数变换,根据数据图选定一个已知的函数g?x?,然后对变换后的数据yt?g?xt?,t?1,2,...,N进行时间序列的分解。采用这种方法有时会得到很好的效果。常用的函数有对数函数lnx,指数函数exp?ax?,倒数函数ax 等。
6.4.2 时间序列第二类分解及长期趋势分析预测模型
1. 时间序列第二类分解和时间数列的构成分析
事物的发展变化同时要受多种因素的影响,在诸多影响因素中,有些对事物的发展起着长期的、决定性的作用,致使事物的发展呈现出某种趋势和一定的规律性;有些则对事物的发展起着短期的、非决定性的作用,致使事物的发展呈现出某种不规则性。作为事物发展数量表现的时间序列,其各个观察值?Yi?正是这些因素共同作用结果的综合体现。
影响时间序列的因素大体上可以分为四种,即长期趋势(T)、季节变动(S)、循环波动
(C)和不规则波动(I)。把这些影响因素同时间序列的关系用一定的数学关系式表达出来,
就构成了时间序列的分解模型。将各影响因素分别从时间序列中分离出去并加以测定的过程,称为时间序列的构成分析。
按四种因素对时间序列的不同影响方式,时间序列可以分为多种模型,如乘法模型、加法模型(第一类分解)、混合模型等。其中最常用的是乘法模型,其表现形式为:
Yi?Ti?Si?Ci?Ii (6.4.12) 乘法模型的基本假设是:四个因素相互之间存在一定的关系,即它们对事物的影响是相互的,并假设这些因素是由不同的原因形成的,但其作用却是相互的。因此,时间序列中各观察值表现为各种因素的乘积。利用乘法模型可以将四个因素很容易地从时间序列中分离出来,因而乘法模型在时间序列分析中被广泛应用,称时间序列第二类分解。
这里主要讨论基于时间序列第二类分解长期趋势的分析方法(其它趋势分析类似)。长期趋势是时间数列的主要构成要素,它是指现象在较长时期内持续发展变化的一种趋向或者状态。通过对时间序列长期趋势的分析,可以掌握现象活动的规律性,并对其未来的发展趋势