多重共线性练习题参考解答

2019-03-06 08:31

多重共线性练习题参考解答

练习题

1.假设在模型Yi??1??2X2i??3X3i?ui中,X2与X3之间的相关系数为零,于是有人建议你进行如下回归:

Yi??1??2X2i?u1iY

i??1??3X3i?u2i(1)是否存在??2???2且??3???3?为什么? (2)??1会等于??1或??1或两者的某个线性组合吗? (3)是否有var???2??var???2?且var???3??var???3?? 2.下表给出了中国商品进口额Y、国内生产总值GDP、消费者价格指数CPI。商品进口额 国内生产总值 居民消费价格指数年份 (亿元) (亿元) (1985=100) 1985 1257.8 8964.4 100 1986 1498.3 10202.2 106.5 1987 1614.2 11962.5 114.3 1988 2055.1 14928.3 135.8 1989 2199.9 16909.2 160.2 1990 2574.3 18547.9 165.2 1991 3398.7 21617.8 170.8 1992 4443.3 26638.1 181.7 1993 5986.2 34634.4 208.4 1994 9960.1 46759.4 258.6 1995 11048.1 58478.1 302.8 1996 11557.4 67884.6 327.9

1

1997 1998 1999 2000 2001 2002 2003 11806.5 11626.1 13736.4 18638.8 20159.2 24430.3 34195.6 74462.6 78345.2 82067.5 89468.1 97314.8 105172.3 117251.9 337.1 334.4 329.7 331.0 333.3 330.6 334.6 资料来源:《中国统计年鉴》,中国统计出版社2000年、2004年。

请考虑下列模型:lnYt??1+?2lnGDPt??3lnCPIt?ui (1)利用表中数据估计此模型的参数。 (2)你认为数据中有多重共线性吗? (3)进行以下回归:

lnYt?A1+A2lnGDPt?v1ilnYt?B1+B2lnCPIt?v2ilnGDPt?C1?C2lnCPIt?v3i根据这些回归你能对数据中多重共线性的性质说些什么?

?和??在5%水平上个别地显著,并且总的F检验也是显著(4)假设数据有多重共线性,但?23的。对这样的情形,我们是否应考虑共线性的问题?

3.克莱因与戈德伯格曾用1921-1950年(1942-1944年战争期间略去)美国国内消费Y和工资收入X1、非工资—非农业收入X2、农业收入X3的时间序列资料,利用OLSE估计得出了下列回归方程:

??8.133?1.059X1?0.452X2?0.121X3Y (8.92) (0.17) (0.66) (1.09) R2?0.95 F?107.37(括号中的数据为相应参数估计量的标准误)。 试对上述模型进行评析,指出其中存在的问题。

4.在本章开始的“引子”提出的“农业和建筑业的发展会减少财政收入吗?”的例子

2

中,如果所采用的数据如下表所示

1978-2003年财政收入及其影响因素数据

财政收入农业增加值工业增加值(亿元)CS (亿元)NZ (亿元)GZ 1132.3 1146.4 1159.9 1175.8 1212.3 1367.0 1642.9 2004.8 2122.0 2199.4 2357.2 2664.90 2937.10 3149.48 3483.37 4348.95 5218.10 6242.20 7407.99 8651.14 9875.95 11444.08 13395.23 16386.04 18903.64 21715.25 1018.4 1258.9 1359.4 1545.6 1761.6 1960.8 2295.5 2541.6 2763.9 3204.3 3831.0 4228.0 5017.0 5288.6 5800.0 6882.1 9457.2 11993.0 13844.2 14211.2 14552.4 14472.0 14628.2 15411.8 16117.3 17092.1 1607.0 1769.7 1996.5 2048.4 2162.3 2375.6 2789.0 3448.7 3967.0 4585.8 5777.2 6484.0 6858.0 8087.1 10284.5 14143.8 19359.6 24718.3 29082.6 32412.1 33387.9 35087.2 39047.3 42374.6 45975.2 53092.9 建筑业增加值(亿元)JZZ 138.2 143.8 195.5 207.1 220.7 270.6 316.7 417.9 525.7 665.8 810.0 794.0 859.4 1015.1 1415.0 2284.7 3012.6 3819.6 4530.5 4810.6 5231.4 5470.6 5888.0 6375.4 7005.0 8181.3 总人口(万最终消费人)TPOP (亿元)CUM 96259 97542 98705 100072 101654 103008 104357 105851 107507 109300 111026 112704 114333 115823 117171 118517 119850 121121 122389 123626 124761 125786 126743 127627 128453 129227 2239.1 2619.4 2976.1 3309.1 3637.9 4020.5 4694.5 5773.0 6542.0 7451.2 9360.1 10556.5 11365.2 13145.9 15952.1 20182.1 26796.0 33635.0 40003.9 43579.4 46405.9 49722.7 54600.9 58927.4 62798.5 67442.5 受灾面积(万公顷)SZM 50760 39370 44530 39790 33130 34710 31890 44370 47140 42090 50870 46991 38474 55472 51333 48829 55043 45821 46989 53429 50145 49981 54688 52215 47119 54506 年份 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 (资料来源:《中国统计年鉴2004》,中国统计出版社2004年版)

试分析:为什么会出现本章开始时所得到的异常结果?怎样解决所出现的问题?

3

练习题参考解答

练习题1参考解答:

?且?????。 ?2??(1) 存在?233?因为?2??yx???x????yx???x???x???x????xx?i2i23ii3i22i23i22i3i23i2ix3i?

当X2与X3之间的相关系数为零时,离差形式的

?x2ix3i?0

?有?2??yx???x??yx???x???x???xi2ii22i23i2i22i?2 ??? ?3??同理有:?3(2)会的。

??var????var????。 ?2?且var?(3) 存在var?233??因为var?2???????x?1?r?22i223?2

??当r23?0时,var?2???x?1?r??x22i223?2??222i?2? ?var????var???? 同理,有var?33

练习题2参考解答: (1)参数估计结果如下:

??ln(进口)??3.649?1.796ln(GDP)?1.208ln(CPI) (0.322) (0.181) (0.354)R2?0.990 R2?0.988 F?770.602(2)数据中有多重共线性,居民消费价格指数的回归系数的符号不能进行合理的经济意义解释,且其简单相关系数呈现正向变动。

(3)分别拟合的回归模型如下:

4

lnY??3.745?1.187ln(GDP) (0.410) (0.039)R2?0.982 R2?0.981 F?939.999lnY??3.39?2.254ln(CPI) (0.834) (0.154)R2?0.926 R2?0.922 F?213.934ln(GDP)?0.144?1.927ln(CPI) (0.431) (0.080)R2?0.972 R2?0.970 F?586.337单方程拟合效果都很好,回归系数显著,判定系数较高,GDP和CPI对进口的显著的单一影响,在这两个变量同时引入模型时影响方向发生了改变,这只有通过相关系数的分析才能发现。

(4)如果仅仅是作预测,可以不在意这种多重共线性,但如果是进行结构分析,还是应该引起注意的。

练习题3参考解答:

从模型拟合结果可知,样本观测个数为27,消费模型的判定系数R?0.95,F统计量为107.37,在0.05置信水平下查分子自由度为3,分母自由度为23的F临界值为3.028,计算的F值远大于临界值,表明回归方程是显著的。模型整体拟合程度较高。 依据参数估计量及其标准误,可计算出各回归系数估计量的t统计量值:

2

t0?8.1331.0590.4520.121?0.91,t1??6.10,t2??0.69,t3??0.11 8.920.170.661.09除t1外,其余的tj值都很小。工资收入X1的系数的t检验值虽然显著,但该系数的估计值过大,该值为工资收入对消费边际效应,因为它为1.059,意味着工资收入每增加一美元,消费支出的增长平均将超过一美元,这与经济理论和常识不符。

另外,理论上非工资—非农业收入与农业收入也是消费行为的重要解释变量,但两者的t检验都没有通过。这些迹象表明,模型中存在严重的多重共线性,不同收入部分之间的相互关系,掩盖了各个部分对解释消费行为的单独影响。

练习题4参考解答

5

根据样本数据得到各解释变量的样本相关系数矩阵如下(见表4.3): 表4.3 样本相关系数矩阵 CS NZ GZ JZZ TPOP CUM SZM CS 1 0.910 0.970 0.967 0.839 0.965 0.515 NZ 0.910 1.000 0.981 0.982 0.946 0.985 0.590 GZ 0.970 0.981 1.000 0.999 0.904 0.999 0.570 JZZ 0.967 0.982 0.999 1.000 0.904 0.998 0.567 TPOP 0.839 0.946 0.904 0.904 1.000 0.917 0.639 CUM 0.965 0.985 0.999 0.998 0.917 1.000 0.575 SZM 0.515 0.590 0.570 0.567 0.639 0.575 1.000 解释变量之间相关系数较高,特别是农业增加值、工业增加值、建筑业增加值、最终消费之间,相关系数都在0.9以上。这显然与第三章对模型的无多重共线性假定不符合。

6


多重共线性练习题参考解答.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:DVR系列中文说明书

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: