摘要
GDP是体现国民经济增长状况和人民群众客观生活质量的重要指标。为了研究影响GDP的潜在因素,通过收集到的样本数据运用课本学过的回归分析知识,建立与GDP有影响的自变量与因变量间的多元线性回归模型,借助统计软件SPSS对样本作初等模型,同时结合统计专业知识对初等模型作F检验、回归系数检验、异方差性检验、假设检验等,确立最终的经验回归方程,回归方程对样本的是拟合度最好的。最后通过对做出来的模型分析得出GDP的主要影响因素,对提高GDP具有一定得现实意义。
引言
在当今欧美主导的经济发展理论下,衡量一个国家的综合实力看的不仅是国家的军事实力、国家影响力,而更看重国家的经济实力,而GDP代表一国或一个地区所有常住单位和个人在一定时期内全部生产活动的最终成果,是当期新创造财富的价值总量,它是一个国家经济实力的最好体现,具有国际可比性,是联合国国民经济核算体系(SNA)中最重要的总量指标,为世界各国广泛使用并用于国际比较。众所周知2008年我国GDP跃居世界第三位,是仅次于美国、日本的第三大经济国,而2009年在金融危机的影响下我国GDP稳中求进,依然保持着9.0%的增长态势。提高GDP已经成为经济发展的潮流,利用国家的各种有限资源,在最大程度上发挥资源的利用率,推动经济的发展是势在必行的,因为资源一直在减少,而人口一直在增加,要保持经济的增长就必要抓住主要因素,提高GDP。
一、多元线性回归模型的基本理论
首先是对线性回归模型基本知识介绍:随机变量y与一般变量x1,x2,x3...xp的理论线性回归模型为:
y??0??1x1??2x2?...??pxp??
其中?0,?1,...,?p 是P+1个未知参数,?0称为回归常数,?1,...,?p称为回归系数。y称为被解释变量(因变量),而x1,x2,...,xp是P个可以精确测量并可控制的一般变量,称为解释变量(自变量)。?是随机误差,在多元线性回归模型中有五个基本假设:
假设一:随机误差项0均值假定E(?i)?0,i?0,1,2,...,n; 假设二:随机误差项同方差var(?i)??2,i?0,1,2,...,n ; 假设三:随机误差项不相关
假设四:随机误差项服从如下正态分布
?i~N(0,?2),i?0,1,2,...ncov(?i,?j)?0,(i?j,i,j?0,1,2,...n);
只有求得的经验回归方程y??0??1x1?...??pxp通过了回归分析中各检验并满足上述四个假设时,我们才可以明确此时的经验回归方程对我们的样本数据拟合得好,可以用此时的回归模型作控制与预测了。
????二、回归模型初步建立与检验
Coefficients Standardized Unstandardized Coefficients Model 1 (Constant) Zscore: 居民消费水平(元) Zscore: 固定资产投资(亿元) Zscore: 职工平均工资(元) Zscore: 居民消费价格指数 Zscore: 工业增加值率(%) Zscore: 农村居民家庭人均纯收入(元) a. Dependent Variable: Zscore: GDP(亿元) 表(1) .094 .069 -.067 -.288 .134 .069 .092 .218 .094 .069 -.067 -.288 .701 1.003 -.732 -1.321 .490 .326 .471 .199 .192 .729 .409 .073 5.211 1.371 2.442 13.683 B 2.377E-15 .317 .946 Std. Error .058 .212 .075 Coefficients Beta t .000 .317 .946 1.493 12.666 Sig. 1.000 .148 .000 Collinearity Statistics Tolerance VIF a .077 .621 13.006 1.611 收集的数据由于存在单位上的差异,且数据量很大,故可能存在误差、量纲的影响。首先将数据标准化,再对样本作模型假设,可得出y对6个自变量的线性回归方程为: y=2.377*E-15+0.317x1+0.946x2+0.094x3+0.069x4+0.069x5-0.067x5-0.288x6
ANOVA Model 1 Regression Residual Total Sum of Squares 27.508 2.492 30.000 df 6 24 30 Mean Square 4.585 .104 F 44.157 Sig. .000 ab a. Predictors: (Constant), Zscore: 农村居民家庭人均纯收入(元), Zscore: 固定资产投资(亿元), Zscore: 居民消费价格指数, Zscore: 工业增加值率(%), Zscore: 职工平均工资(元), Zscore: 居民消费水平(元) b. Dependent Variable: Zscore: GDP(亿元)表(2) 应用F检验对回归方程进行显著检验,检验统计量为:F=SSR/SSE,SSR为回归回归平方和,SSE为残差
平方和,从上表中的结果可以看出显著性p值,由于p近似为0,在显著水平为0.05的条件下:p﹤?,
可知其回归方程高度显著。
三、回归方程系数检验
但回归方程显著并不表示每个自变量对y的影响都显著,因此我们队方程的回归系数作显著性检验。如果某个自变量对y的作用不显著,那么在模型中相应的系数值就为0。提出假设检验:H0:βj=0,j=1,2…p 若接受原假设,则自变量不显著;若拒绝原假设,那么相应的自变量是显著的。
参考表(1),虽然该方程F检验回归方程是显著的,但在显著性水平取0.05时,某些单个自变量对y并不显著。
Correlations Zscore: Zscore: 工(%) -.471 ** SpearmaZscore: Corren's rho GDP(亿元) lation Coefficient Sig. (2-tailed) N Zscore: Corre居民消费latioCoefficient Sig. (2-tailed) N Zscore: Corre固定资产投资(亿元) lation Coefficient Sig. (2-tailed) 水平(元) n Zscore: GDP(亿元) Zscore: 居民消Zscore: 固定资产职工平均Zscore: 居民业增加值率Zscore: 农村居民家费水平(元) 投资(亿元) **工资(元) 消费价格指数 .187 -.357 *庭人均纯收入(元) .732 **1.000 .629 **.953 . .000 .000 .315 .049 .007 .000 31 .629 **31 1.000 31 .589 **31 .491 **31 -.318 31 -.612 **31 .879 **.000 . .000 .005 .081 .000 .000 31 .953 **31 .589 **31 1.000 31 .143 31 -.348 31 -.425 *31 .646 **.000 .000 . .444 .055 .017 .000 N Zscore: Corre职工平均latioCoefficient Sig. (2-tailed) N Zscore: Corre居民消费latioCoefficient Sig. (2-tailed) N Zscore: Corre工业增加latioCoefficient Sig. (2-tailed) N Zscore: Corre农村居民家庭人均纯收入(元) lation Coefficient Sig. (2-tailed) N 值率(%) n 价格指数 n 工资(元) n 31 .187 31 .491 **31 .143 31 1.000 31 -.100 31 -.280 31 .357 *.315 .005 .444 . .592 .127 .049 31 -.357 *31 -.318 31 -.348 31 -.100 31 1.000 31 .475 **31 -.445 *.049 .081 .055 .592 . .007 .012 31 -.471 **31 -.612 **31 -.425 *31 -.280 31 .475 **31 1.000 31 -.663 **.007 .000 .017 .127 .007 . .000 31 .732 **31 .879 **31 .646 **31 .357 *31 -.445 *31 -.663 **31 1.000 .000 .000 .000 .049 .012 .000 . 31 31 31 31 31 31 31 **. Correlation is significant at the 0.01 level (2-tailed). *. Correlation is significant at the 0.05 level (2-tailed). 表(3) 从上表中可以看出,y与x1、x2、x5的相关系数较大,说明自变量与y高度相关。其他几个变量对y的贡献不是很大,故需剔除一些变量。
四、检验异方差性及自相关
Model Summary Adjusted R Model 1 2 3 4 5 6 7 R 1.000 1.000 1.000 1.000 1.000 1.000 1.000 gfedcbahStd. Error of the Estimate .00000002 .00000002 .00000002 .00000002 .00000002 .00000002 .00000002 Durbin-Watson R Square 1.000 1.000 1.000 1.000 1.000 1.000 1.000 Square 1.000 1.000 1.000 1.000 1.000 1.000 1.000 .408 h. Dependent Variable: Zscore: GDP(亿元)表(4) 从表(4)中我们可以知道DW值=0.408,根据书中表4.4可以知道,误差项之间存在正自相关。我们再根据DW分布表,查得临界值dl=1.16,du=1.74,再根据书中表4.5可知,DW=0.408<1.16,故可知误差项之间存在正相关。
Coefficients Standardized Unstandardized Coefficients Model 1 (Constant) Zscore: 居民消费水平(元) Zscore: 固定资产投资(亿元) Zscore: 职工平均工资(元) Zscore: 居民消费价格指数 9.384E-17 .000 .000 .000 1.000 .700 1.429 2.225E-16 .000 .000 .000 1.000 .188 5.318 2.041E-15 .000 .000 .000 1.000 .081 12.381 B -1.169 -3.211E-16 Std. Error .000 .000 Coefficients Beta t -9.014E7 .000 .000 Sig. .000 1.000 Collinearity Statistics Tolerance VIF a .070 14.214