Anovac 模型 1 回归 残差 总计 2 回归 残差 总计 平方和 1.830E7 3917298.522 2.222E7 1.830E7 3921126.262 2.222E7 df 5 10 15 4 11 15 均方 3660971.683 391729.852 F 9.346 Sig. .002a 4575257.669 356466.024 12.835 .000b a. 预测变量: (常量), x6, x3, x2, x4, x5。 b. 预测变量: (常量), x6, x3, x2, x4。 c. 因变量: y 系数a 模型 非标准化系数 B 1 (常量) x2 x3 x4 x5 x6 2 (常量) x2 x3 x4 x6 a. 因变量: y 5922.827 4.864 2.374 -817.901 14.539 -846.867 6007.320 5.068 2.308 -824.261 -862.699 标准 误差 2504.315 2.507 .842 187.279 147.078 291.634 2245.481 1.360 .486 167.776 232.489 标准系数 试用版 t 2.365 .677 .782 -1.156 .050 -.899 1.940 2.818 -4.367 .099 -2.904 2.675 .706 .760 -1.165 -.916 3.727 4.750 -4.913 -3.711 Sig. .040 .081 .018 .001 .923 .016 .022 .003 .001 .000 .003 y?6007.320?5.068x2?2.308x3?824.261x4?862.699x6
?
(3)逐步回归
模型汇总
30
模型 R 1 2 3 .498a .697b .811c R 方 .248 .485 .657 调整 R 方 .194 .406 .572 标准 估计的误差 1092.83206 937.95038 796.60909 a. 预测变量: (常量), x3。 b. 预测变量: (常量), x3, x5。 c. 预测变量: (常量), x3, x5, x4。 Anovad 模型 1 回归 残差 总计 2 回归 残差 总计 3 回归 残差 总计 a. 预测变量: (常量), x3。 b. 预测变量: (常量), x3, x5。 c. 预测变量: (常量), x3, x5, x4。 d. 因变量: y 平方和 5502210.090 1.672E7 2.222E7 1.079E7 1.144E7 2.222E7 1.461E7 7615032.418 2.222E7 df 1 14 15 2 13 15 3 12 15 均方 5502210.090 1194281.918 F 4.607 Sig. .050a 5392697.554 879750.910 6.130 .013b 4869041.506 634586.035 7.673 .004c 系数a 模型 非标准化系数 B 1 (常量) x3 2 (常量) x3 x5 3 (常量) x3
5161.259 1.511 472.298 3.188 212.325 1412.807 3.440 标准 误差 1142.744 .704 2150.138 .913 86.643 1865.912 .782 标准系数 试用版 t 4.517 .498 2.146 .220 3.492 2.451 .757 4.398 Sig. .000 .050 .830 .004 .029 .464 .001 1.050 .737 1.133 31
x5 x4 a. 因变量: y 348.729 -415.136 92.220 169.163 1.210 -.587 3.782 -2.454 .003 .030 y?1412.807?3.440x3?348.729x5?415.136x4
?(4)两种方法得到的模型是不同的,回退法剔除了x5,保留了x6, x3, x2, x4作为最终模型。而逐步回归法只引入了x3。说明了方法对自变量重要性的认可不同的,这与自变量的相关性有关联。相比之下,后退法首先做全模型的回归,每一个变量都有机会展示自己的作用,所得结果更有说服力
第六章 多重共线性的情形及其处理
6.6对财政收入的数据,分析数据的多重共线性,并根据多重共线性剔除变量。将所得结果与用逐步回归法所得的选元结果相比较。
答:
首先,采用方差扩大因子法,使用SPSS软件诊断财政收入的多重共线性问题,得到的计算结果如下。 Coefficients aUnstandardized Coefficients Std. Model 1 (Constant) x1 B Error Standardized Coefficients Collinearity Statistics TolerancBeta t Sig. e VIF 1348.338 2211.463 .610 .552 -.641 .167 -1.125 -3.840 .002 .003 319.484 2636.56.000 4 .002 479.288 x2 -.317 .204 -1.306 -1.551 .143 x3 -.413 .548 -.270 -.752 32
.464
x4 x5 -.002 .671 -.008 .024 .128 .008 -.007 -.087 3.706 5.241 -.020 -.928 .932 .000 .369 .037 27.177 1860.72.001 6 .574 1.743 x6 a. Dependent Variable: y 从输出结果看到,x2,x5的方差扩大因子很大,分别为VIF2?2636,VIF7?1860, 远远超过10。说明财政收入的数据存在严重的多重共线性。
其次采用特征根判定法,使用SPSS软件诊断财政收入的多重共线性问题,得到的计算结果如下。 Collinearity Diagnostics Variance Proportions DimensEigenvaCondition (ConsModel ion 1 1 2 3 4 5 6 7 lue 6.127 .857 .011 .004 .001 Index tant) x1 x2 x3 x4 x5 x6 a1.000 .00 .00 .00 .00 .00 2.673 .00 .00 .00 .00 .00 23.954 .01 .00 .00 .00 .00 38.000 .01 .16 .00 .07 .00 98.485 .02 .11 .08 .78 .02 .00 .00 .00 .00 .00 .81 .00 .00 .07 .03 .20 .09 .72 .07 .000 119.124 .11 .55 .04 .01 .13 7.352E-5 288.677 .85 .18 .88 .14 .85 a. Dependent Variable: y
从条件数看到,最大的条件数k7?288.677,说明自变量之间存在严重的多重共线性问题。这与方差扩大因子法的结果一致。
先剔除方差扩大因子最大的x2,重新做回归,结果如下,发现自变量之间仍然存在严
重的多重共线性问题。
33
Coefficients Standardized Unstandardized CoefficientCoefficients Std. Model 1 B (Constant-1252.83) x1 x3 x4 x5 x6 Error 1.508E3 2 .163 .459 .017 .078 .008 Beta t Sig. s Collinearity Statistics Tolerance VIF -.831 .419 -1.291 -4.524 .000 -.604 -2.012 .063 .093 1.591 .132 2.815 6.527 .000 -.028 -1.274 .222 a-.735 -.923 .026 .510 -.011 .004 276.969 .003 306.617 .086 11.605 .002 632.896 .608 1.645 a. Dependent Variable: y
再剔除方差扩大因子最大的x5,重新做回归,结果如下,发现自变量之间仍然存在严
重的多重共线性问题。
Coefficients Unstandardized Coefficients Model 1 B Std. Error 2829.351 .235 .526 .031 .015 Standardized Coefficients Beta t Collinearity Statistics Sig. Tolerance .006 160.513 .009 111.949 .087 .649 11.507 1.540 VIF a(Constant) -2715.046 x1 x3 x4 x6 -.047 1.463 .036 .003 -.960 .352 -.083 -.202 .843 .957 2.781 .013 .128 1.160 .263 .008 .206 .839 a. Dependent Variable: y
34