能源消费标工业增加国内生产总年份 准煤总量Y/值X3/亿值X2/亿元 万吨 元 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 76682 80850 86632 92997 96934 98703 103783 109170 115993 122737 131176 138948 137798 132214 133831 138553 143199 151797 174990 203227 223319 246270 265583 9016 10275.2 12058.6 15042.8 16092.3 18667.8 21781.5 26923.5 35333.9 48197.9 60793.7 71176.6 78973 84402.3 89677.1 99214.6 109655.2 120332.7 135822.8 159878.3 183084.8 211923.5 249529.9 3448.7 3967 4585.8 5777.2 6484 6858 8087.1 10284.5 14188 19480.7 24950.6 29447.6 32921.4 34018.4 35861.5 4003.6 43580.6 47431.3 54945.5 65210 76912.9 91310.9 107367.2 建筑业增加值X4/亿元 417.9 525.7 665.8 810 794 859.4 1015.1 1415 2266.5 2964.7 3728.8 4387.4 4621.6 4985.8 5172.1 5522.3 5931.7 6465.5 7490.8 8694.3 10133.8 11851.1 14014.1 交通运输邮电业增加值X5/亿元 406.9 475.6 544.9 661 786 1147.5 1409.7 1681.8 2205.6 2898.3 3424.1 4068.5 4593 5278.4 5821.8 7333.4 8406.1 93930.4 10098.4 12147.6 10526.1 12481.1 14604.1 人均电力消费X6/千瓦时 21.3 23.2 26.4 31.2 35.3 42.4 46.9 54.6 61.2 72.7 83.5 93.1 101.8 106.6 118.2 132.4 144.6 156.3 173.7 190.2 216.7 249.4 274.9 能源加工转换效率X7/% 68.29 68.32 67.48 66.54 66.51 67.2 65.9 66 67.32 65.2 71.05 71.5 69.23 69.44 69.19 69.04 69.03 69.04 69.4 70.71 71.08 71.24 71.25
一、模型的估计与调整 (一)参数估计 1、双击“Eviews”,进入主页。输入数据:点击主菜单中的File/Open /EV Workfile—Excel—多重共线性的数据.xls ;
2、在EV主页界面的窗口,输入“ls y c x2 x3 x4 x5 x6 x7”,按“Enter”.出现OLS回归结果,图2:
Dependent Variable: Y Method: Least Squares Date: 11/01/10 Time: 11:34 Sample: 1985 2007
Included observations: 23
Variable C X2 X3 X4 X5 X6 X7
R-squared
Coefficient
168326.2 -0.142290 0.503108 8.294237 -0.203037 233.9125 -1373.376
Std. Error
108641.0 0.763550 0.248552 10.43112 0.111019 388.5188 1588.868
t-Statistic
1.549381 -0.186353 2.024157 0.795143 -1.828841 0.602062 -0.864373
Prob.
0.1408 0.8545 0.0600 0.4382 0.0861 0.5556 0.4002
139364.6 51705.05 21.17469 21.52028 133.6365 0.000000
0.980436 Mean dependent var 0.973099 S.D. dependent var 8480.388 Akaike info criterion 1.15E+09 Schwarz criterion -236.5089 F-statistic 1.380303 Prob(F-statistic)
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
由此可见,该模型的可决系数为0.995,修正的可决系数为0.993,模型拟和很好,F统计量为701.47,模型拟和很好,回归方程整体上显著。
但是当?=0.05时,t?/2(n?k)=t0.025(23)=2.069,不仅X4、X5、X6、X7的系数t检验不显著,而且X2、X4、X6系数的符号与预期相反,这表明很可能存在严重的多重共线性。(即除了农业增加值X2、工业增加值X3外,其他因素对财政收入的影响都不显著,且农业增加值X2、建筑业增加值X4、最终消费X6的回归系数还是负数,这说明很可能存在严重的多重共线性。)
(二)多重共线性的诊断与修正
3、计算各解释变量的相关系数:
在Workfile窗口,选择X2、X3、X4、X5、X6、X7数据,点击“Quick”—Group Statistics—Correlations—OK,出现相关系数矩阵,如图3:
图3: 相关系数矩阵
X2 X3 X2 1 0.9657320838X3 X4 X5 X6 X7 0.96573208380.99868578980.34534502620.99725788850.743816435386627 1 55332 5441 23411 40805 0.96559240190.32394415240.95659516720.719495371386627 X4 X5 X6 X7
0.99868578980.965592401955332 5441 23411 40805 81592 40546 02685 82113 81592 1 40546 73121 1 02685 15234 31066 1 82113 31427 46146 0.72634236114161 1 0.32985465290.99488534670.75578863970.36632189040.20555571750.34534502620.32394415240.329854652973121 15234 31427 0.99725788850.95659516720.99488534670.366321890431066 46146 0.74381643530.71949537130.75578863970.20555571750.72634236114161 由相关系数矩阵可以看出,各解释变量相互之间的相关系数较高,特别是农业增加值X2、工业增加值X3、建筑业增加值X4、最终消费之间X6,相关系数都在0.8以上。 这表明模型存在着多重共线性。
1、采用逐步回归法,去检验和解决多重共线性问题。分别作Y对X2、X3、X4、X5、X6、X7的一元回归,结果如下图4:在EV主页界面的窗口,输入“ls y c x2”,“回车键”。 依次如上推出X3、X4、X5、X6、X7的一元回归。综上所述,结果如下图4:
图4.一元回归估计结果 变量 参数估计值 t统计量
X20.734835 25.31517 0.968271 0.966760 X31.665481 18.02565 0.939293 0.936402 X413.19088 25.96363 0.969789 0.968350 X50.737886 1.294529 0.073903 0.029803 X6678.0058 22.42294 0.959907 0.957998 X719332.30 4.702427 0.512906 0.489711 R2R2X2、其中,加入 2 的R最大,以 X 2 为基础,顺次加入其他变量逐步回归。结果如下图5:
图5.加入新变量的回归结果(一)
变量 X2,X3 X2,X4 X2,X5 X2 0.532664 2X3 0.481737 X4 X5 X6 X7 R2(5.092034) (2.001247) 0.148765 (0.263146) 0.754738 (26.06504) (1.038045) -0.20948 (-1.99037) 0.970869 10.52602 0.966883 0.970921 X2,X6 X2,X7
0.947069 (2.373029) 0.754414 (17.10268) -197.2125 (-0.533247) -951.478 (-0.596733) 0.965709 0.965588
(三)异方差的诊断与修正
该模型样本回归估计式的书写形式为:
Y = 11.44213599 + 0.6267829962*X (3.629253) (0.019872)
t= 3.152752 31.54097
R?0.944911 R?0.943961 S.E.=9.158900 DW=1.597946 F=994.8326
※(一)图形法
1、在“Workfile”页面:选中x,y序列,点击鼠标右键,点击Open—as Group—Yes
2、在“Group”页面:点击View-Graph—Scatter—Simple Scatter, 得到X,Y的散点图(图3所示): 22150001000050000E2-5000-10000-15000-20000050000100000X2200000300000
2、Goldfeld-Quandt法进行检验。
a.将样本X按递增顺序排序,去掉中间1/4的样本,再分为两个部分的样本,即n1=n2=9。
Dependent Variable: Y Method: Least Squares Date: 11/01/10 Time: 11:07 Sample: 1 9
Included observations: 9
Variable C X
R-squared
Coefficient
-15.15272 0.000210
Std. Error
0.772901 8.01E-06
t-Statistic
-19.60500 26.28514
Prob.
0.0000 0.0000
5.000000 2.738613 0.577264 0.621092 690.9084 0.000000
0.989970 Mean dependent var 0.988537 S.D. dependent var 0.293208 Akaike info criterion 0.601798 Schwarz criterion -0.597687 F-statistic 1.352108 Prob(F-statistic)
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
Dependent Variable: Y Method: Least Squares Date: 11/01/10 Time: 11:08 Sample: 1 9
Included observations: 9
Variable C X
R-squared
Coefficient
8.851030 5.42E-05
Std. Error
0.991996 5.14E-06
t-Statistic
8.922445 10.53771
Prob.
0.0000 0.0000
19.00000 2.738613 2.354299 2.398127 111.0434 0.000015
0.940700 Mean dependent var 0.932228 S.D. dependent var 0.712943 Akaike info criterion 3.558014 Schwarz criterion -8.594347 F-statistic 0.632734 Prob(F-statistic)
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
b.分别对两个部分的样本求最小二乘估计,得到两个部分的残差平方和,即
?e21i= 0.601798 ,
?e22i= 3.558014