提 纲
1.引言 2.计量模型
2.1确定模型的解释变量 2.2主成分分析
2.2.1选择主成分分析方法的缘由 2.2.2确定模型的数学形式
2.2.3对GDP影响因素的主成分分析过程 2.3参数估计及检验 2.3.1拟合回归模型
2.3.2回归检验法检验序列相关 2.3.3异方差性检验 2.3.4修正后模型
2.4 1989—2002年中国GDP贡献率和影响因素分析 3.结论和政策建议
摘 要:本文利用主成分分析的方法,从国民经济核算支出法的角度,对影响我国国内生产总值的七个因素建立计量模型,并进行实证分析。通过一系列统计分析和检验方法,拟合出比较优良的GDP模型,得出1989—2002年间我国经济增长的情况。由此来分析所选取的这七个变量对GDP的贡献情况,结合当前我国宏观经济形势,找出目前经济发展存在的问题,从而找出相应的对策。
关键词: GDP 计量分析 主成分分析 影响因素
Abstract: The method that this text utilizes main composition to analyze, in
terms of expenditure approach of the national business accounting, set up the model of measuring to seven factors which influence the gross domestic product of our country, and carry on real example analysis. Through a series of statistical analysis and method of inspection, fit out finer GDP model, draw the situation of the economic growth of our country among 1989-2002. Come seven variable situation of contributing in GDP these chosen to analyses, combine the present macroeconomic situation of our country, find out the existing problem of economic development at present, thus find out the corresponding countermeasure.
Keywords: GDP Econometric Analysis Principal Component Analysis Influence factor
基于主成分分析的我国GDP影响因素实证分析 作者:赖 艳 指导老师:刘小瑜 1. 引言
改革开放以来,中国经济取得了令全世界震惊的巨大成就,持续25年年均增长率超过9%,经济总规模已经稳居世界第6位。2003年中国经济增长率更是高达9.1%,比国际组织预测的全球主要国家的经济增速高两倍左右。因此,许多专家学者指出,我国目前的经济形势是上世纪90年代中期以来最好的。[①]由此可见,GDP作为现代国民经济核算体系的核心指标,它的总量可以反映一个国家和地区的经济发展及人民的生活水平,其结构可反映社会生产与使用,投资与消费之间的比例关系及宏观经济效益,对于经济研究、经济管理都具有十分重要的意义。尤其从1985年我国开始正式统计GDP后,它就越来越受到人们的关注。GDP的核算中有许多因素在起着作用,为此,本文拟从定量研究的角度出发,通过主成分分析的方法对国内生产总值GDP的影响因素作计量模型的实证分析,以期分析各影响因素对经济增长的贡献情况,结合我国当前的宏观经济形势,对国家宏观经济政策提出一点自己的看法。
2. 计量模型
2.1确定模型的解释变量
核算GDP有生产法,收入法和支出法三种方法,其中支出法是从社会产品最终使用去向的角度来核算GDP的,即积累、消费与出口。GDP=总投资+总消费+净出口,而本文选择影响GDP的因素(解释变量)正是基于最终使用的角度考虑的。这是因为支出法的核算对象具有完整的实物形态,各因素的统计资料比较易于收集。
本文将GDP模型的解释变量确定为税收(SS),社会消费品零售总额(XFP),全国固定资产投资(TZ),从业人口数(RK),教育投资(JY),实际利用外资额(WZ),进出口总额(JCK)7个变量。之所以选择以上因素作为解释变量,是因为:税收是国家财政收入的主要来源对经济总量的积累有重要作用。社会消费品零售总额从实物形态上反映了社会总消费的规模,对GDP有决定性影响。固定资产投资包括基本建设,更新改造,房地产投资及城乡各种固定资产投资等,在总投资中占很大比重,对GDP影响较大。实际利用外资额反映一个国家的对外开放程度,扩大利用外资的规模仍然是加快我国经济发展和体制变革的重要因素,同时通过利用外资能够有效地带动我国产业结构的调整优化。[②] 因此实际利用外资对于GDP增长的作用可见一斑。进出口总额的规模对GDP的大小有很重要的影响。而国家财政性的教育投资经费关系到对人力资本的培养,对GDP有创造性的贡献。另外,经济活动以人为本,劳动力是生产发展中最活跃的因素,是重要的生产资源,从业人口数也是促进经济增长的生力军。
2.2主成分分析
2.2.1 选择主成分分析方法的缘由
对于以上所选取的因素(解释变量),从定性方面探讨无法确定其重要程度,显然也很难确定哪一个是主要因素,哪一个是次要因素。由于它们之间有切实的内在联系,在一定程度上反映的信息有所重叠。只凭经验或单纯的定性分析,会有主观性和任意性。由于各因素的相互关联和相互依赖,不适合建立一般的逐步回归模型,而宜采用主成分分析的方法。主成分分析就是设法将原来众多具有一定相关性的指标,重新组合成一组新的相互无关的综合指标,来替代原来的指标。通常数学上的处理就是将原来P个指标做线形组合,作为新的综合指标。通过这样简化结构,消除变量之间的多重共线性。找出影响GDP的一个或少数几个综合指标,使综合指标为原来变量的线形组合。选取的第一个线形组合,我们要求它的方差是最大的,这样它所包含的信息就越多,将它称作第一主成分。如果第一主成分不足以代表原来P个指标的信息,即第一主成分的累积贡献率没有达到85%以上,那么就再考虑选取第二主成分。依次类推可以选出第三、第四??第
k个主成分。这些主成分之间互不相关,且它们的方差依次递减。这样,选出的综合指标不仅保留了原始变量的主要信息,彼此之间又不相关,比原始变量具有更优越的性质。用筛选出的主要因素构造回归系数,要比一般回归模型精度更高。
2.2.2 确定模型的数学形式
将著名的柯布—道格拉斯Cobb-Dauglas生产函数推广建立GDP模型。本文中构建的GDP模型,正是将劳动和资本细化分解为七个影响经济增长的主要因素,即:
、
(2.1)
为了计算的方便,对式(2.1)两边取对数使之线形化,即:
(2.2)
2.2.3对GDP影响因素的主成分分析过程
样本数据如下:
表2.1 1989—2002年中国GDP及其影响因素 year GDP SS XFP 8101.40 8050.53 9106.00 TZ RK JY WZ JCK 4156.00 5560.10 7225.80 9119.60 1989 16909.20 2727.40 1990 17625.43 2821.86 1991 19232.27 2990.17 4410.40 55329.00 5294327.10 100.59 4517.00 64749.00 6577836.30 102.89 5594.50 65491.00 7315028.20 115.54
1992 21935.25 3296.91 10332.42 8080.10 66152.00 8670490.50 192.02 1993 24812.62 4255.30 10864.95 13072.30 66808.00 10599374.40 389.60 11271.00 1994 27945.33 5126.88 13106.12 17042.10 67455.00 14887812.60 432.13 20381.90 1995 30461.47 6038.04 17608.88 20019.30 68065.00 18779501.10 481.33 23499.90 1996 33432.26 6909.82 22875.44 22913.50 68950.00 22623393.50 548.04 24133.80 1997 36303.40 8234.04 26555.35 24941.10 69820.00 25317325.70 644.08 26967.20 1998 39137.17 9262.80 29387.60 28406.20 70637.00 29490592.00 585.57 26849.70 1999 41946.03 10682.58 31576.77 29854.70 71394.00 33490416.40 526.59 29896.20 2000 45471.11 12581.51 34016.53 32917.70 72085.00 38490805.80 593.56 39273.20 2001 48653.65 15301.38 37333.86 37213.50 73025.00 46376626.20 496.72 42183.60 2002 52691.91 17636.45 40951.45 43499.90 73740.00 57213764.50 550.11 51378.20 资料来源:《中国统计年鉴2003》,以1989年价格推算。
data ly;
input year $ GDP SS XFP TZ RK JY WZ JCK; LnGDP=LOG(GDP); LnSS=LOG(SS); LnXFP=LOG(XFP); LnTZ=LOG(TZ); LnRK=LOG(RK); LnJY=LOG(JY); LnWZ=LOG(WZ); LnJCK=LOG(JCK); Cards;
利用SAS软件对上述影响GDP的7个因素的对数化形式进行主成分分析:
; run;
proc princomp out=prinly;
var LnSS LnXFP LnTZ LnRK LnJY LnWZ LnJCK;
run;
Principal Component Analysis
表2.2 Correlation Matrix LNSS LNXFP LNTZ LNRK LNJY LNWZ LNJCK LNSS 1.0000 0.9858 0.9594 0.8376 0.9933 0.8382 0.9602 LNXFP 0.9858 1.0000 0.9581 0.8317 0.9887 0.8547 0.9549 LNTZ 0.9594 0.9581 1.0000 0.8646 0.9777 0.9536 0.9891 LNRK 0.8376 0.8317 0.8646 1.0000 0.8755 0.8016 0.8957 LNJY 0.9933 0.9887 0.9777 0.8755 1.0000 0.8760 0.9821 LNWZ 0.8382 0.8547 0.9536 0.8016 0.8760 1.0000 0.9257 LNJCK 0.9602 0.9549 0.9891 0.8957 0.9821 0.9257 1.0000
表2.3 Eigenvalues of the Correlation Matrix
PRIN1 PRIN2 PRIN3 PRIN4 PRIN5 PRIN6 PRIN7
Eigenvalue Difference 6.52326 0.22796 0.21388 0.02284 0.00973 0.00182 0.00050 6.29530 0.01408 0.19104 0.01311 0.00791 0.00132 Proportion 0.931894 0.032566 0.030554 0.003263 0.001390 0.000260 0.000072 Cumulative 0.93189 0.96446 0.99501 0.99828 0.99967 0.99993 1.00000 表2.4 Eigenvectors
LNSS PRIN1 0.381537 PRIN2 -.425175 -.406220 PRIN3 0.145705 0.069480 PRIN4 -.173564 0.673982 PRIN5 0.608146 -.416320 PRIN6 PRIN7 0.428397 0.262558 -.046126 0.234387 LNXFP 0.381469