《计量经济学》实验报告纸
【实验作者】学号: 2011014184 姓名: 陈乐朋 班级: 信计111班 【实验名称】序列相关、多重共线性的检验与修正 【实验目的】
1、 理解序列相关的概念,掌握序列相关出现的原因与后果; 2、 理解多重共线性的概念,掌握多重共线性出现的原因与后果;
3、 掌握序列相关常见的检验方法,包括图示法、DW、回归检验法与LM检验法等; 4、 掌握多重共线性常见的检验方法,包括相关系数、VIF法等;
5、 掌握广义差分法等序列方差的修正方法,能够利用EViews软件进行实现; 6、 掌握逐步回归法等多重共线性的修正方法,能够利用EViews软件进行实现。 【实验内容】
1、中国1980-2000年投资总额X与工业总产值Y的统计资料如下表所示。 年度 全社会固定资产投资 工业增加值 年度 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 910.9 961.0 1230.4 1430.1 1832.9 2543.2 3120.6 3791.7 4753.8 4410.4 4517.0 1996.5 2048.4 2162.3 2375.6 2789.0 3448.7 3967.0 4585.8 5777.2 6484.0 6858.0 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 全社会固定资产投资 工业增加值 5594.5 8080.1 13072.3 17042.1 20079.3 22913.5 22941.1 28406.2 29854.7 32917.7 8087.1 10284.5 14143.8 19359.6 24718.3 29082.6 32412.1 33387.9 35087.2 39570.3 (1)当设定模型为lnYt??0??1lnXt??t时,是否存在序列相关性?
(2)若按一阶自相关假设?t???t?1??t,试用Durbin两步法与广义最小二乘法估计原模型;
(3)采用差分形式Xt*?Xt?X?t1与Yt*?Yt?Yt?1作为新数据,估计模型
Yt*??0??1Xt*?vt,该模型是否存在序列相关性?
2、经初步分析,影响电信业务总量Y的主要因素有邮政业务总量X1、中国人口数X2、 年度 1991
Y(亿元) X2(亿) X1(亿元)151.63 52.75 11.5823 1
X3 0.2637 X5(元) X4(元)1879 896 《计量经济学》实验报告纸
1992 1993 1994 1995 1996 1997 1998 1999 226.57 382.45 592.30 875.51 1208.75 1268.95 2264.94 3132.38 63.67 80.26 95.89 113.34 133.29 144.34 166.28 198.44 11.7171 11.8517 11.9850 12.1121 12.2389 12.3626 12.4810 12.5909 0.2763 0.2814 0.2862 0.2904 0.2937 0.2992 0.3040 0.3089 2287 2939 3923 4854 5576 6053 6307 6534 1070 1331 1746 2236 2641 2834 2972 3143 城镇人口占总人口的比重X3、人均GDPX4、全国居民人均消费水平X5,数据如下表所示(1)试建立关于电信业务总量的多元线性回归模型
(2)检验模型是否存在多重共线性。
(3)如果存在多重共线性,则对模型进行适当修正,给出一个比较合理的模型形式。 3、下表给出了中国商品进口额Y、国内生产总值GDP、消费者价格指数CPI
年份 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 考虑建立如下的模型
商品进口额(亿元) 国内生产总值(亿元) 1257.8 1498.3 1614.2 2055.1 2199.9 2574.3 3398.7 4443.3 5986.2 9960.1 11048.1 11557.4 11806.5 11626.1 13736.4 18638.8 20159.2 24430.3 34195.6 8964.4 10202.2 11962.5 14928.3 16909.2 18547.9 21617.8 26638.1 34634.4 46759.4 58478.1 67884.6 74462.6 78345.2 82067.5 89468.1 97314.8 105172.3 117251.9 消费者价格指数 100 106.5 114.3 135.8 160.2 165.2 170.8 181.7 208.4 258.6 302.8 327.9 337.1 334.4 329.7 331.0 333.3 330.6 334.6 lnYt??0??1lnGDPt??2lnCPIt??t
(1)利用表中的数据估计模型中的参数; (2)是否存在多重共线性? (3)进行以下回归
2
《计量经济学》实验报告纸
lnYt??0??1lnGDPt??1t lnYt??0??1lnCPIt??2t lnGDPt??0??1lnCPIt??3t
根据这些回归,使对数据中的多重共线性的性质作出说明。
【结果分析】
题一:
(1) 是否存在序列相关性
首先画出自变量与因变量的散点图,如图1,两者具有较好的线性关系。
40,00035,00030,00025,00020,00015,00010,0005,0000010,00020,000X30,00040,000Y
图 1
然后建立模型。将数据输入到Eviews中后,建立模型 ls log(y) c log(x) 得到分析结果如下
Dependent Variable: LOG(Y) Method: Least Squares Date: 04/08/14 Time: 09:27 Sample: 1980 2000 Included observations: 21
Variable C LOG(X)
R-squared
Coefficient 1.430400 0.873297
Std. Error 0.199492 0.022713
t-Statistic 7.170226 38.44905
Prob. 0.0000 0.0000 9.031179 1.062296
0.987311 Mean dependent var 0.986643 S.D. dependent var
3
Adjusted R-squared
《计量经济学》实验报告纸
S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
0.122773 Akaike info criterion 0.286389 Schwarz criterion 15.29901 Hannan-Quinn criter. 1478.330 Durbin-Watson stat 0.000000
-1.266572 -1.167094 -1.244983 0.515870
模型结果为:
Ln?=1.4304+0.873297lnx (0.0000)(0.0000)
R2=0.987 F=1478.33 DW=0.51587
在置信度为5%的显著性水平下,各个参数均能通过t检验,但是DW分布在样本量为21的下限临界值为1.22,0.51587小于1.22,表明存在自相关性。
(2) 若按一阶自相关假设?t???t?1??t,试用Durbin两步法与广义最小二乘法估计原模型
一、Durbin两步法:
估计模型:lnYt=plnYt-1+β0(1-p)+ β1(lnXt-plnXt-1)
在Eviews中输入:ls log(y) c log(y(-1)) log(x) log(x(-1)) 得到分析结果如下所示:
Dependent Variable: LOG(Y) Method: Least Squares Date: 04/08/14 Time: 09:28 Sample (adjusted): 1981 2000
Included observations: 20 after adjustments
Variable C LOG(Y(-1)) LOG(X) LOG(X(-1))
R-squared
Coefficient 0.478786 0.610808 0.425197 -0.067960
Std. Error 0.151422 0.084854 0.079033 0.113837
t-Statistic 3.161934 7.198352 5.379976 -0.596995
Prob. 0.0060 0.0000 0.0001 0.5589 9.102781 1.036599 -3.206903 -3.007757 -3.168028 1.143909
0.998444 Mean dependent var 0.998152 S.D. dependent var 0.044564 Akaike info criterion 0.031776 Schwarz criterion 36.06903 Hannan-Quinn criter. 3421.366 Durbin-Watson stat 0.000000
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
因此估计方程为:
ln?t=0.478786+0.610808lnYt-1+0.425197lnXt-0.06796lnXt-1
(0.006) (0.0000) (0.0001) (0.5589) R2=0.998 F=3421.366 DW=1.143909
然后,将估计的p=0.610808代入差分模型,得到广义模型。
在Eviews中输入ls log(y)-0.610808*log(y(-1)) c log(x)-0.610808*log(x(-1))
4
《计量经济学》实验报告纸
得到结果如下所示:
Dependent Variable: LOG(Y)-0.610808*LOG(Y(-1)) Method: Least Squares Date: 04/08/14 Time: 09:31 Sample (adjusted): 1981 2000
Included observations: 20 after adjustments
Variable C
LOG(X)-0.610808*LOG(X(-1)) R-squared
Coefficient 0.448094 0.901570
Std. Error 0.142255 0.039947
t-Statistic 3.149928 22.56911
Prob. 0.0055 0.0000 3.633944 0.415141 -2.149210 -2.049637 -2.129772 1.545938
0.965868 Mean dependent var 0.963972 S.D. dependent var 0.078798 Akaike info criterion 0.111765 Schwarz criterion 23.49210 Hannan-Quinn criter. 509.3646 Durbin-Watson stat 0.000000
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
最小二乘估计为
lnYt-0.610808lnYt-1=0.448094+0.90157(lnXt-0.610808lnXt-1) (0.0055) (0.0000)
R2=0.965868 F=509.3646 DW=1.545938
同理,在5%的显著性水平下,样本容量为20的DW检验的临界值的上下限为dL=1.20,dU=1.41,检验值落在(dL,dU)之外,故不能确定是否存在一阶序列相关。对该模型进行LM法检验,在输出结果窗口中选择“View\\Residual \\Series Correlation LM Test”,并在弹出的对话框中输入滞后数“1”,得到
Breusch-Godfrey Serial Correlation LM Test: F-statistic Obs*R-squared
Test Equation:
Dependent Variable: RESID Method: Least Squares Date: 04/08/14 Time: 09:32 Sample: 1981 2000 Included observations: 20
Presample missing value lagged residuals set to zero.
Variable C
LOG(X)-0.610808*LOG(X(-1))
Coefficient 0.005122 -0.001343
Std. Error 0.144152 0.040474
t-Statistic 0.035534 -0.033170
Prob. 0.9721 0.9739
0.568517 Prob. F(1,17) 0.647200 Prob. Chi-Square(1)
0.4612 0.4211
5