1.单位根检验
1)
* 单位根过程(随机游走)
*
* y_t = y_t-1 + e_t, e_t -- IID(0,sigma^2) * y_t = c0 + y_t-1 + e_t,
2)一般检验方法:
* - D-F 检验(Dickey-Fuller t-test)
* - ADF 检验(Augmented Dickey-Fuller test) * - DF-GLS (modified Dickey-Fuller) * - PP 检验 * - KPSS 检验 *
* 离群值与结构突变
* - 考虑离群值的单位根检验
* - 允许一个结构突变的单位根检验 * - 允许两个结构突变的单位根检验
I. D-F 检验
* y_t = a0 + rho*y_t-1 + deta*t + u_t (1) *
* OLS 估计,但往往存在严重的序列相关
II. Augmented Dickey-Fuller unit-root test(ADF 检验)
* H0: y_t 为单位根过程 * H1:y_t 是平稳序列
* (1) 式两边同时减去 y_t-1 可得: *
* D.y_t = a + b*y_t-1 + deta*t + (c1*D.y_t-1 + c2*D.y_t-2 + ... + ck*D.y_t-k) * 漂移项 时间趋势项 为了控制序列相关 * 注意:b = rho-1
* 四种形式:对应不同的真实数据生成过程(DGP),影响临界值
*-------------------------------------------------------------
* 形式 process under H0 参数限制 dfuller 选项 * ------------------------------------------------------------ * 1 RW,无漂移项 a=0, deta=0 noconcstant * 2 RW,无漂移项 deta=0 (默认设置) * 3 RW,有漂移项 deta=0 drift * 4 RW,有或无漂移项 无 trend
* ------------------------------------------------------------ * 说明:
* (1) 在 Case2 和 Case3 中,回归时都会加入常数项,但临界值的计算不同; * 在 Case1 和 Case2 中,计算临界值时,原假设都是 a=0; * 而在 Case3 中,计算临界值时,原假设是 a!=0 。
use lutkepohl.dta, clear
dfuller lconsumption /*ln(消费) 为单位根过程*/ dfuller lconsumption, regress /* Case2 */
dfuller lconsumption, regress lag(3) /*控制序列相关*/ dfuller lconsumption, regress lag(3) trend /* Case4 */ dfuller lconsumption, regress nocon /* Case1 */ dfuller lconsumption, regress drift /* Case3 */
dfuller lconsumption, regress /*case2,请与Case3的临界值对比*/
* 结论:无论采用哪种方式,都无法拒绝H0,在不同的形式下,临界值是不同的 * 同时,根据理论,消费通常是含有趋势项的, * 因为消费水平随着时间的增加而提高 * 所以,Case4 在本例中比较合适
* ln(消费)的一阶差分是平稳的 dfuller D.lconsumption
dfuller D.lconsumption , trend
III. modified Dickey-Fuller t-test (Elliot,et al., 1996,Econometrica)
* DF-GLS
* Ho:y_t 为单位根过程 * H1:y_t 是一个平稳过程
* 形式1:趋势平稳(即,包含一个时间趋势项)defult
* 形式2:一般平稳(不包含时间趋势项)加入 notrend 选项即可 * 先对数据做一定的转换(GLS),进而估计上述差分形式的模型
dfgls lconsumption dfgls D.lconsumption
*--- Phillips-Perron unit-root test (Phillips-Perron, 1987)
* 模型:
* y_t = a + b*t + rho*y_t-1 + e_t *
* 特点:采用 Newey-West (1987) 稳健型标准误来控制序列相关问题
* 而 dfuller 命令则通过放入多个差分滞后项来控制序列相关问题 * 只有三种形式:
*-------------------------------------------------------------
* 形式 process under H0 参数限制 pprron 选项 * ------------------------------------------------------------ * 1 RW,无漂移项 a=0, deta=0 noconcstant * 2 RW,无漂移项 deta=0 (默认设置) * 4 RW,有或无漂移项 无 trend
* ------------------------------------------------------------ * 事实上,Case3 是 Case4 的特例。
IV.
pperron lconsumption
pperron lconsumption , lag(4) trend
pperron lconsumption , lag(4) trend regress
pperron linvest, lag(4) trend regress pperron D.linvest, lag(4) regress
V. 考虑离群值的单位根检验 Vogelsang (1999)
* Vogelsang, T.J. 1999.
* Two Simple Procedures for Testing for a Unit Root * When There are Additive Outliers.
* Journal of Time Series Analysis 20: 237-52.
* 如果序列中有结构断点,如石油危机等,会导致传统的单根检定过度接受H0 * dfao 处理方法:自动寻找断点,加入虚拟变量
use pervog92.dta, clear line lfiuscpi year
dfuller lfiuscpi /*拒绝单位根*/
dfgls lfiuscpi /*无法拒绝单位根,两个结果差别很大*/ dfao lfiuscpi /*拒绝单位根,看细表*/
dfao lfiuscpi, notr lev(90)
dfao lfiuscpi, notr lev(90) reg
VI. 允许一个结构突变的单位根检验
*- Zivot-Andrews(1992)检验 *
* Andrews, D., Zivot, E. 1992.
* Further evidence on the Great Crash, the oil price shock, and * the unit-root hypothesis.
* Journal of Business and Economic Statistics 10, 251-70.
* 基本思想:
* Ho: y_t = y_t-1 + d1*DTB_1t + u_t *
* H1: y_t = c0 + c1*t + d1*DTB_1t + u_t *
* 模型: *
* y_t = c0 + rho*y_t-1 + d1*DTB_1t + u_t * *
use wpi1.dta, clear line wpi t line ln_wpi t dfuller ln_wpi
dfgls ln_wpi
zandrews ln_wpi /*无法拒绝原假设:存在单根*/ zandrews ln_wpi, graph
zandrews ln_wpi, lagmethod(BIC) zandrews ln_wpi, break(trend)
zandrews ln_wpi, break(trend) graph
*- Clemente,Montanes,and Reyes(1998)检验
* 基本思想:对 Perron and Vogelsang(1992) 方法进行扩展 *
* Ho: y_t = y_t-1 + d1*DTB_1t + u_t *
* H1: y_t = c0 + d1*DTB_1t + u_t *
* 模型: *
* y_t = c0 + rho*y_t-1 + d1*DTB_1t + u_t *
use wpi1.dta, clear line wpi t
clemao1 wpi, graph
clemio1 D.wpi /* 不平稳 */ dfuller D.wpi /* 平稳 */ dfgls D.wpi /* 不平稳 */
VII. 允许两个结构突变的单位根检验 Clemente,Montanes,and Reyes(1998)
*
* Clemente, J., Montanes, A., Reyes, M., 1998.
* Testing for a unit root in variables with a double change in the mean. * Economics Letters 59, 175-182.
* 基本思想:对 Perron and Vogelsang(1992) 方法进行扩展 *
* Ho: y_t = y_t-1 + d1*DTB_1t + d2*DTB_2t + u_t *
* H1: y_t = c0 + d1*DTB_1t + d2*DTB_2t + u_t *
* 模型: *
* y_t = c0 + rho*y_t-1 + d1*DTB_1t + d2*DTB_2t + u_t *
use wpi1.dta, clear clemao2 wpi, graph clemao2 D.wpi, graph
dfuller D.wpi /* 平稳 */ dfgls D.wpi /* 不平稳 */
* 评论:
* (1) 在允许两个结构突变的情况下,D.wpi 是平稳的; * (2) dfuller 检验结果似乎比较稳健,相对于 dfgls
2.3 非平稳时间序列的平稳化
对非平稳序列进行平稳化处理。如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,如果数据存在异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值无显著地异于零。
1)单整
2)趋势平稳与差分平稳随机过程
3)协整与误差修正
三、平稳时间序列模型
3.1 ARIMA模型预测的基本程序:
1) 根据时间序列的散点图、自相关函数和偏自相关函数图以ADF单位根检验其方差、趋势及其季节性变化规律,对序列的平稳性进行识别。一般来讲,经济运行的时间序列都不是平稳序列。
2) 对非平稳序列进行平稳化处理。如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,如果数据存在异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值无显著地异于零。
3) 根据时间序列模型的识别规则,建立相应的模型。若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合AR模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合MA模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合ARMA模型。
4) 进行参数估计,检验是否具有统计意义。
5) 进行假设检验,诊断残差序列是否为白噪声。 6) 利用已通过检验的模型进行预测分析。
cd C:\\stata10\\Net_course\\ B6_TimeS
3.2 AR 过程(自回归过程)
1)AR(1): y_t = rho*y_{t-1} + u_t
AR(p): y_t = r_1*y_{t-1} + r_2*y_{t-2} + ... + r_p*y_{t-p} + u_t
clear
sim_arma y_ar, ar(0.9) nobs(300) line y_ar _t, yline(0)
自相关系数(ACF)
Cov[y_t, y_{t+s}] r_s = ------------------- Var[y_t] 偏自相关系数(PACF)