lny?9.932?0.421lnx6 (0.116) (0.026)R2?0.926 R2?0.922 F?261.551B:进行逐步回归,直至模型符合需要研究的问题,具有实际的经济意义和统计意义。采用逐步回归的办法,去检验和解决多重共线性问题。分别作lnY对
lnX1,lnX2,lnX3,lnX4,lnX5,lnX6,lnX7的一元回归,结果如下:
一元回归结果:
变量 lnX1 lnX2 0.315 14.62 0.911 0.906 lnX3 0.277 9.718 0.818 0.809 lnX4 0.297 13.22 0.893 0.888 lnX5 0.273 11.717 0.867 0.861 lnX6 0.421 16.173 0.926 0.922 lnX7 8.73 4.648 0.507 0.484 参数估计值 0.316 t统计量 可决系数 调整可决系数 14.985 0.914 0.910 其中加入lnX6的方程调整的可决系数最大, 以lnX6为基础, 顺次加入其他变量逐步回归。结果如下表:
变量 lnX6 lnX1 lnX6 lnX2 lnX6 lnX3 lnX6 lnX4 lnX6 lnX5 lnX6 lnX7 lnX1 -0.186 (-0.698) -0.251 (-1.021) 0.061 (1.548) -0.119 (-0.897) -0.623 (-7.127) lnX2 lnX3 lnX4 lnX5 lnX6 0.666 (1.891) 0.753 (2.308) 0.341 (5.901) 0.585 (3.167) 1.344 (10.314) 0.391 (11.071) 0.924 0.977 0.921 0.927 0.922 lnX7 R2 0.920 经比较,新加入lnX5的方程调整可决系数改进最大, 各参数的t检验也都显著,但是lnX5参数
的符号与经济意义不符合。若再加入其他变量后的逐步回归,若剔除不显著的变量和无经济意义的变量后, 仍为第一步所建只包含lnX6的一元回归模型。
如果需要建立多元线性回归模型,则需寻找新的变量或改变模型形式。 例如, 不取对数作全部变量多元线性回归,结果为:
可以看出还是有严重多重共线性。作逐步回归: 分别作一元回归得到: 变量 参数估计值 t 统计量 X1 0.7333 26.4698 0.9709 0.9695 X1 6.6399(0.0022) 0.5512 (0.0000) 0.5040 (0.3356) 1.0516 (0.0000) 1.0075 (0.0088) 0.7499 (0.0000) X2 0.7353 0.9684 0.9669 X2 -5.9308 (0.0054) X3 1.6655 0.9393 0.9364 X3 0.4349 (0.0821) X4 X4 13.1909 25.9636 0.9697 0.9683 X5 X5 10.8980 13.5147 0.8969 0.8920 X6 -255.80 (0.438) X6 678.0058 22.4229 0.9599 0.9580 X7 -813.44 (0.5988) X7 19332.30 4.7024 0.5129 0.4897 25.3627 18.0257 R2 R2 X1,X2 X1,X3 X1,X4 X1,X5 X1,X6 X1,X7 以X1为基础加入其他变量, 结果为: R2 0.9785 0.9726 0.9683 0.9766 0.9690 0.9684 4.1326 (0.6580) -5.0269 (0.013) 注: 括号中为p值. 可以发现加入X2、X5、X6、X7后参数的符号不合理,加入X4后并不显著。只有加入X3后修正的可决系数有所提高,而且参数符号的经济意义合理, X3参数估计值的p值为0.0821,在10%的显著性水平下是显著的。所以相对较为合理的模型估计结果可以为:
0.
可是这里的lnX2和lnX5的参数符号为负,在经济意义上并不合理。说明多重共线性影响仍然很严重。
4.7 在本章开始的“引子”提出的“农业的发展反而会减少财政收入吗?”的例子中,如果所采用的数据如下表所示
表4.13 1978-2007年财政收入及其影响因素数据 建筑业增加受灾面积财政收入农业增加值工业增加值总人口(万最终消费年份 值(亿(千公(亿元)CS (亿元)NZ (亿元)GZ 人)TPOP (亿元)CUM 元)JZZ 顷)SZM 1978 1132.3 1027.5 1607 138.2 96259 2239.1 50790 1979 1146.4 1270.2 1769.7 143.8 97542 2633.7 39370 1980 1159.9 1371.6 1996.5 195.5 98705 3007.9 44526 1981 1175.8 1559.5 2048.4 207.1 100072 3361.5 39790 1982 1212.3 1777.4 2162.3 220.7 101654 37148 33130 1983 1367 1978.4 2375.6 270.6 103008 4126.4 34710 1984 1642.9 2316.1 2789 316.7 104357 4846.3 31890 1985 2004.8 2564.4 3448.7 417.9 105851 5986.3 44365 1986 2122 2788.7 3967 525.7 107507 6821.8 47140 1987 2199.4 3233.0 4585.8 665.8 109300 7804.6 42090 1988 2357.2 3865.4 5777.2 810 111026 9839.5 50870 1989 2664.9 4265.9 6484 794 112704 11164.2 46991 1990 2937.1 5062.0 6858 859.4 114333 12090.5 38474 1991 3149.48 5342.2 8087.1 1015.1 115823 14091.9 55472 1992 3483.37 5866.6 10284.5 1415 117171 17203.3 51333 1993 4348.95 6963.8 14188 2266.5 118517 21899.9 48829 1994 5218.1 9572.7 19480.7 2964.7 119850 29242.2 55043 1995 6242.2 12135.8 24950.6 3728.8 121121 36748.2 45821 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 7407.99 8651.14 9875.95 11444.08 13395.23 16386.04 18903.64 21715.25 26396.47 31649.29 38760.20 51321.78 14015.4 14441.9 14817.6 14770.0 14944.7 15781.3 16537.0 17381.7 21412.7 22420.0 24040.0 28095.0 29447.6 32921.4 34018.4 35861.5 4003.6 43580.6 47431.3 54945.5 65210 76912.9 91310.9 107367.2 4387.4 4621.6 4985.8 5172.1 5522.3 5931.7 6465.5 7490.8 8694.3 10133.8 11851.1 14014.1 122389 123626 124761 125786 126743 127627 128453 129227 129988 130756 131448 132129 43919.5 48140.6 51588.2 55636.9 61516 66878.3 71691.2 77449.5 87032.9 96918.1 110595.3 128444.6 46989 53429 50145 49981 54688 52215 47119 54506 37106 38818 41091 48992 (资料来源:《中国统计年鉴2008》,中国统计出版社2008年版) 试分析:为什么会出现本章开始时所得到的异常结果?怎样解决所出现的问题?
练习题4.7参考解答:
(1)根据样本数据得到各解释变量的样本相关系数矩阵如下: 样本相关系数矩阵
解释变量之间相关系数较高,特别是农业增加值、工业增加值、建筑业增加值、最终消费之间,相关系数都在0.9以上。这显然与第三章对模型的无多重共线性假定不符合。 (2)解决方案:
采用逐步回归的方式,可以得到没有共线性的回归模型,但可能存在设定偏误。 合并工业增加值与建筑业增加值,得到财政收入与第二产业的回归。
取对数再回归,可以减低共线性。
第五章
5.1 设消费函数为
Yi??1??2X2i??3X3i?ui
式中,Yi为消费支出;X2i为个人可支配收入;X3i为个人的流动资产;ui为随机误差项,并且E(ui)?0,Var(ui)??X2i(其中?为常数)。试解答以下问题:
222
(1)选用适当的变换修正异方差,要求写出变换过程;
(2)写出修正异方差后的参数估计量的表达式。
练习题5.1参考解答:
2(1)因为f(Xi)?X2i,所以取W2i?1,用W2i乘给定模型两端,得 X2iYiXu1??1??2??33i?iX2iX2iX2i X2i上述模型的随机误差项的方差为一固定常数,即
Var(
ui1)?2Var(ui)??2X2iX2i
(2)根据加权最小二乘法,可得修正异方差后的参数估计式为
??Y*???X*???X*?12233
??2
W???2i**2****yi*x2i???W2ix3i????W2iyix3i???W2ix2ix3i?**??W2ix2*2i???W2ix3*2i????W2ix2ix3i?2
??3 其中
??W?2i**2****yi*x3i???W2ix2i????W2iyix2i???W2ix2ix3i?**??W2ix2*2i???W2ix3*2i????W2ix2ix3i?2
X
*2WX???W2i2i2i,X*3WX???W2i2i3i,Y*WY???W
2ii2i**x?X?X2i2 2i**x3?X?Xi3i3y*?Yi?Y*
5.2 下表是消费Y与收入X的数据,试根据所给数据资料完成以下问题: (1)估计回归模型Y??1??2X?u中的未知参数?1和?2,并写出样本回归模型的书写格式;
(2)试用Goldfeld-Quandt法和White法检验模型的异方差性; (3)选用合适的方法修正异方差。
表5.8 某地区消费Y与收入X的数据(单位:亿元) Y X Y X Y X