表1我国居民消费水平及6个影响因素数
居民消费年份 水平 y 932 1,116 1,393 1,833 2,355 2,789 3,002 3,159 3,346 3,632 3,887 4,144 4,475 5,032 5,596 6,299 7,310 8,430 9,283 10,522 国内生产总值 x1 21,781.50 26,923.48 35,333.92 48,197.86 60,793.73 71,176.59 78,973.03 84,402.28 89,677.05 99,214.55 109,655.17 120,332.69 135,822.76 159,878.34 184,937.37 216,314.43 265,810.31 314,045.43 340,902.81 401,512.80 农村居民人均收入 x2 708.6 784 921.6 1,221.00 1,577.70 1,926.10 2,090.10 2,162.00 2,210.30 2,253.40 2,366.40 2,475.60 2,622.20 2,936.40 3,254.90 3,587.00 4,140.40 4,760.60 5,153.20 5,919.00 城镇居民人均收入 x3 1,700.60 2,026.60 2,577.40 3,496.20 4,283.00 4,838.90 5,160.30 5,425.10 5,854.00 6,280.00 6,859.60 7,702.80 8,472.20 9,421.60 10,493.00 11,759.50 13,785.80 15,780.80 17,174.70 19,109.40 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
农村居民家庭恩格尔系数(%) x4 57.6 57.6 58.1 58.9 58.6 56.3 55.1 53.4 52.6 49.1 47.7 46.3 45.6 47.2 45.5 43 43.1 43.7 41 41.1 农村居民家庭恩格尔系数(%) x5 53.8 53 50.3 50 50.1 48.8 46.6 44.7 42.1 39.4 38.2 37.7 37.1 37.7 36.7 35.8 36.3 37.9 36.5 35.7 居民定期存款储蓄 x6 7,634.90 9,445.00 12,108.34 16,838.70 23,778.25 30,873.21 36,226.74 41,791.57 44,955.11 46,141.66 51,434.86 58,788.94 68,498.67 78,138.86 92,263.54 103,011.38 104,934.45 139,300.16 160,230.38 178,413.90 (数据来源:1991年-2010年的统计年鉴) 五.估计参数
模型设定为:
Yi??0??1X1??2X2??3X3??4X4??5X5??6X6??1所示
图1
3
利用Eviews,采用普通最小二乘法进行模型参数的估计,得到的结果如图
图1
模型估计的结果为:
?Y?845.4029?0.006499X1?0.761381X2?0.134887X3?2.545970X4?12.50248X5?0.002969X6
t=(2.593877) (3.421765) (10.09391) (2.872417) (-0.262499) (-1.391960) (1.377416)
2R2?0.9998508 0 R?0.9997 F?14400.93
(模型一)六.模型检验
1、经济意义检验
模型估计结果说明,在假定其它变量不变的情况下,当年GDP每增长1亿元,我国居民消费水平增加0.006499元;在假定其它变量不变的情况下,当年农村居民人均收入每增长1元,居民消费水平就会增长0.761381元;在假定其它变量不变的情况下,当年城镇居民人均收入增长1元,居民消费水平就会增加0.134887元;在假定其它变量不变的情况下,当年农村居民家庭恩格尔系数增长1%,居民消费水平就会减少2.545970元;在假定其它变量不变的情况下,当城
镇居民家庭恩格尔系数增长1%,居民消费水平就会减少12.50243元,
4
在假定其它变量不变的情况下,当年居民存款储蓄增长1元,居民消费水平就会增加0.002969元。这与理论分析和经验判断相一致。
2、统计检验
(1)拟合优度:由表中数据可以得到:R2?0.999850,修正的可决系数为,与1十分接近,这说明模型对样本的拟合很好。 R2?0.999780
(2)F检验:针对H0:?1??2??3??4??5??6?0,给定显著性水平
??0.05,在F分布表中查出自由度为6和13的临界值F(6,13)?2.92。由于
F?14400.93>F(6,13)?2.92,应拒绝原假设
、“ 农村居H0:?1??2??3??4??5??6?0,说明回归方程显著,即“GDP”
民人均收入”、“ 城镇居民人均收入”、“ 农村居民家庭恩格尔系数”、“ 城镇居民家庭恩格尔系数”、“居民存款储蓄”等变量联合起来确实对“居民消费水平”有显著影响。 (3)t 检验:分别针对H0:?0??1??2??3??4??5??6?0,给定显著性水平??0.05,查t分布?4表得自由度为20-7=13临界值t?/2(13)?2.1604。由
?????表3.4中数据可得,与0、?1、?2、3、?4、5、6对应的t统计量分别
为2.593877、3.421765、10.09391、2.872417、-0.262499 、-1.391960 、1.377416 ,仅
????????0、?1、?2、?3其绝对值均大于
t?/2(13)?2.1604,这说明,当在其
????它解释变量不变的情况下,解释变量“GDP”(X1)、“农村居民人均收入”(X2)、“城镇居民人均收入”(X3)分别对被解释变量“居民消费水平”Y都有显著的影响。
虽然模型一的拟合优度比较高,F检验也通过了,可是模型一中解释变量X4、X5、X6的参数估计量未通过t 检验,这表明很可能存在严重的多重共线性,说明回归结果可能是伪回归。
5
七.多重共线
1、多重共线的检验
计算各解释变量的相关系数,选择X1、X2、X3、X4、X5、X6数据,点”view/correlations”得相关系数矩阵(如表2):或在命令窗口中键入:cor X1 X2 X3 X4 X5 X6
表2 解释变量X1、X2、X3、X4、X5、X6的相关系数矩阵
由相关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。
2、多重共线修正
(一)分别作Y对X1、X2、X3、X4、X5、X6的一元回归,结果如表3所示:
表3 X1、X2、X3、X4、X5、X6的一元回归后的统计参数
变量 X1 X2 1.883429 X3 0.534644 X4 -386.5189 X5 -344.4878 X6 0.054126 参数估计值 0.024625 t 统计量 44.40866 0.990955 65.86520 93.75091 0.995868 0.997956 -9.102073 0.821513 -5.988880 0.668542 45.60130 0.991418 R2 2按R的大小排序为:X3、X2、X6、X1、X4、X5。
6
(二)逐步回归
(1)以X3为基础,顺次加入其他变量逐步回归。首先加入X2回归结果如图2:
图2
?Y??806?0.13X3?0.75X2?0.006X1?14.5X5?0.003X6
T=(2.8)(2.9) (12.2) (3.7) (-3.1) (1.5)
R2?0.99 F=18512.2
可以发现,系数估计值高度显著,拟合优度为0.99,故保留X2
(2)保留X2,加入X6进行回归。可以发现,X6的系数估计值不显著,予以剔除。
(3)以X2,X3为解释变量,加入X1进行回归, 可以发现,X1的系数估计值不显著,予以剔除。
7