上证综合
年份
指数 1999 2000 2001 一年期存款利率
GDP
(%)
人民币汇率
城镇居民可支配收入
1366.58 2073.48 1645.97 2.25 89677.10 2.25 99214.60 2.25 109655.20 827.83 827.84 827.70 5854.00
6280.00
6859.60
2002 1357.65 1.98 120332.70 827.70 2003 1497.04 1.98 135822.80 827.70 2004 1266.50 2.25 159878.30 827.68 2005 1161.06 2.25 183217.40 819.17 2006 2675.47 2.52 211923.50 797.18 2007 5261.56 3.47 257305.60 760.40 2008
1820.81
3.06 300670.00
694.51
资料来源:《中国统计年鉴》,中国人民银行官方网站
2.建立模型
由上诉分析,建立股价指数与各影响因素之间的线性回归模型:
y= ax1+bx2+αx3+βx4+c+ξ
运用OLS对公式进行多元线性回归分析,得到一下结果:
7702.80
8472.20
9421.60
10493.00
11759.50
13785.80
15780.76
表1 回归分析结果
得到模型:
⑴ Y=4612.697x1-0.125388x2+14.36947x3+2.50612x4-23978.02+ξ
R =0.898657 R=0.817582 DW=2.419191 F=11.08429
方程的R较高,说明方程整体上是合理的,能很较好地拟合数据。但x2,x3,x4的t值都小于临界值,无法通过检验。出现这种情况的原因可能是由于解释变量之间存在多重共线性。下面进行相关系数检验:
在EVIEWS 软件的命令窗口键入 :COR Y X1 X2 X3 X4 X5 输出的相关系数矩阵如表2:
22?2
表2 相关系数表
从表中可以看出,x1与y的相关度最高,其他三个解释变量与被解释变量的相关度相对较弱。这四个变量之间也是高度相关的,说明模型确实存在多重共线性。
为了消除变量间的多重共线性,下面采用“向前逐步回归法”,根据新变量的引入造成原有变量的显著性变化状况来决定是否保留该变量。
①运用OLS 方法逐一求对各个解释变量的回归。利用EVIEWS 软件即得以下六个一元回归模型:
⑵ Y=2095.69x1-3071.531 t=3.984069 p=0.0040
R2= 0.623 DW= 2.055378 F= 15.87281
⑶ y=0.008873x2+532.8614 t=1.691022 p=0.1293
R2= 0.171237 DW= 2.210520 F= 2.859555
⑷ y=-11.74750x3+11454.91 t=-1.318577 p=0.2238
R2= 0.075847 DW= 2.231490 F= 1.738644
⑸ y=0.185177x4+227.3385 T=1.630179 p=0.1417
R2= 0.155523 DW= 2.178304 F= 2.657485
从以上五个模型的统计检验结果并结合模型(1)和表1,经综合分析,可知上证综合指数y与一年期存款利率x1的线性关系最强,拟合程度好,所以选择模型(2):Y=2095.69x1-3071.531 作为最基本的模型。
将其余变量逐个引入模型,估计结果列入表3(其中括号内的数字为t统计量值)
表3 逐步回归分析结果
模型 Y=f(x1) Y=f(x1,x2) Y=f(x1,x3) 2095.69 (3.984069) 0.664891 0.745399 0.855090 0.623 X1 X2 X3 X4 R2 R2 3162.858 -0.008696 (3.640638(-1.48778) 4) 3716.196 (5.716792) 21.31510 (3.3031124) 0.672656 0.813687 Y=f(x1,x4) 3007.759 (3.569424) 3670.652 (4.929087) 3660.76 (5.037389) -0.163701 0.7338(-1.3464124 7) 0.855866 0.657774 Y=f(x1,x2, x3) Y=f(x1,x3, x4) Y=f(x1,x2, ,x4) 0.001190 (0.17972522.63637 ) (2.144408) 23.19406 (2.271137) 0.783799 0.035589 (0.273167) 3.621832 (-3.244854) 0.856870 0.785305 -0.186407 4792.305((-2.424424.890482) 9) 0.865543 0.798315
由上表可知,当模型⑵只引入一个变量时,可以看出在引入变量x3时,R最优,而且此时的t为最大,而以x1和x3为变量的模型再引入其他变量时效果都不如此模型,最终得到最佳模型:
y=3716.196x1+21.3151x3-24135.34+ξ t= (5.716792) (3.031124) (-3.443555) p= (0.0007) (0.0191) (0.0108)
R2=0.813687 DW= 2.027959 F=20.65288
2②异方差检验
采用White 检验法检验回归残差的异方差。在EVIEWS 软件的方程窗口中点击:View\\Residual Test\\White Heteroskedasticity,得结果如下表4: