第四章 多元线性回归模型
4.1 某经济学家试图解释某一变量Y 的变动。他收集了Y 和5 个可能的解释变 量1 C ~ 5 C 的观测值(共10 组),然后分别作三个回归,结果如下(括号中数字
为t 统计量):
(1) t U ) = 51.5 + 3.21 1t C R 2 =0.63 (3.45) (5.21)
(2) t U ) = 33.43 + 3.67 1t C + 4.62 2t C + 1.21 3t C R 2 =0.75 (3.61) (2.56) (0.81) (0.22)
(3) t U ) = 23.21 + 3.82 1t C + 2.32 2t C + 0.82 3t C + 4.10 4t C + 1.21 5t C
(2.21) (2.83) (0.62) (0.12) (2.10) (1.11) R 2 =0.80
你认为应采用哪一个结果?为什么? 4.2 为研究旅馆的投资问题,我们收集了某地的1987-1995 年的数据来估计收益 生产函数R=ALαKβeμ,其中R=旅馆年净收益(万年),L=土地投入,K=资金 投入,e 为自然对数的底。设回归结果如下(括号内数字为标准误差): R?
ln = -0.9175 + 0.273lnL + 0.733lnK R2 =0.94 (0.212) (0.135) (0.125)
(1) 请对回归结果作必要说明; (2)分别检验α和β的显著性; (3)检验原假设:α=β= 0;
4.3 我们有某地1970-1987 年间人均储蓄和收入的数据,用以研究1970-1978 和1978 年以后储蓄和收入之间的关系是否发生显著变化。引入虚拟变量后,估 计结果如下(括号内数据为标准差):
t U ) = -1.7502 + 1.4839D + 0.1504 t C - 0.1034D· t C R2 =0.9425 (0.3319) (0.4704) (0.0163) (0.0332) 其中:Y=人均储蓄,X=人均收入,D= 0, 1970 1978 1, 1979 1987 - ìí ? - 年 年
请检验两时期是否有显著的结构性变化。
4.4 说明下列模型中变量是否呈线性,系数是否呈线性,并将能线性化的模型 线性化。
(1) 0 1 2 2 1 1
y u x x = b + b + b + (2) 1 0 y x u = b b +
(3) ( 0 1 ) 1
1 x u y e - b +b + = +
4.5 有学者根据某国19 年的数据得到下面的回归结果: 2 1 2
? 58.9 0.20 0.10 0.96 : (0.0092) (0.084)
t t t Y X X R Se = - + - =
其中:Y=进口量(百万美元),X1 =个人消费支出(百万美元), X2 =进口价格/国内价格。
(1)解释截距项以及X1 和X2 系数的意义;
(2)Y 的总变差中被回归方程解释的部分、未被回归方程解释的部分各是多 少?
(3)进行回归方程的显著性检验,并解释检验结果;
(4)对“斜率”系数进行显著性检验,并解释检验结果。
4.6 由美国46 个州1992 年的数据,Baltagi 得到如下回归结果: : (0.91) (0.32) (0.20)
log 4.30 1.34log 0.17log 2 0.27
Se c = - p + Y R =
其中,C=香烟消费(包/人年),P=每包香烟的实际价格 Y=人均实际可支配收入
(1)香烟需求的价格弹性是多少?它是否统计上显著?若是,它是否统计上异 于-1? (2)香烟需求的收入弹性是多少?它是否统计上显著?若不显著,原因是什么? (3)求出R2。
4.7 有学者从209 个公司的样本,得到如下回归结果(括号中数字为标准误差): log( ? ) 4.32 0.280log( ) 0.0174 0.00024 2 0.283 (0.32) (0.035) (0.0041) (0.00054) Salary = + sales + roe + ros R =
其中,Salary=CEO 的薪金 Sales=公司年销售额 roe=股本收益率(%) ros=公司股票收益 请分析回归结果。
4.8 为了研究某国1970-1992 期间的人口增长率,某研究小组估计了下列模型: : (781.25)(54.71) 1 ln( ) 4.73 0.024
t pop t t 模型: = +
: (2477.92) (34.01) ( 17.03) (25.54)
2 ln( ) 4.77 0.015 0.075 0.011( ) -
= + - +
t pop t D D t t t t 模型:
其中:Pop=人口(百万人),t=趋势变量, ? í ì =
年以前 年及以后 0 1978 1 1978 D 。
(1)在模型1 中,样本期该地的人口增长率是多少?
(2)人口增长率在1978 年前后是否显著不同?如果不同,那么1972-1977 和 1978-1992 两时期中,人口增长率各是多少?
4.9 设回归方程为Y=β0+β1X1+β2X2+β3X3+ u, 试说明你将如何检验联合假 设:β1= β2 和β3 = 1 。
4.10 下列情况应引入几个虚拟变量,如何表示? (1) 企业规模:大型企业、中型企业、小型企业; (2) 学历:小学、初中、高中、大学、研究生。 4.11 在经济发展发生转折时期,可以通过引入虚拟变量来表示这种变化。例如, 研究进口消费品的数量Y 与国民收入X 的关系时,数据散点图显示1979 年前后 明显不同。请写出引入虚拟变量的进口消费品线性回归方程。 4.12 柯布-道格拉斯生产函数 a bu Y = AK L 其中:GDP=地区国内生产总值(亿元) K=资本形成总额(亿元) L=就业人数(万人) P=商品零售价格指数(上年=100)
试根据中国2003 年各省数据估计此函数并分析结果。数据如下表所示。 地区 gdp K L P 地区 gdp K L P
北京 3663.10 2293.93 858.6 98.2 湖北 5401.71 2141.90 2537.3 101.2 天津 2447.66 1320.47 419.7 97.4 湖南 4638.73 1738.27 3515.9 100.6 河北 7098.56 3128.80 3389.5 100.2 广东 13625.87 5259.48 4119.5 100.0 山西 2456.59 1230.34 1469.5 100.3 广西 2735.13 1030.40 2601.4 100.2 内蒙古 2150.41 1299.27 1005.2 99.6 海南 670.93 315.66 353.8 100.4 辽宁 6002.54 2333.67 1861.3 98.9 重庆 2250.56 1314.20 1659.5 99.5 吉林 2522.62 1102.87 1044.6 100.5 四川 5456.32 2295.26 4449.6 100.1 黑龙江 4430.00 1307.86 1622.4 99.7 贵州 1356.11 759.63 2118.4 100.0 上海 6250.81 2957.20 771.5 99.0 云南 2465.29 1147.12 2349.6 99.9 江苏 12460.83 6182.38 3610.3 99.8 西藏 184.50 104.58 130.7 99.4 浙江 9395.00 4639.06 2961.9 99.6 陕西 2398.58 1447.73 1911.3 100.5 安徽 3972.38 1455.21 3416.0 101.3 甘肃 1304.60 610.83 1304.0 100.2 福建 5232.17 2396.91 1756.7 99.1 青海 390.21 294.25 254.3 100.8 江西 2830.46 1354.99 1972.3 100.1 宁夏 385.34 320.43 290.6 99.5
山东 12435.93 5788.53 4850.6 100.2 新疆 1877.61 1119.21 721.3 99.2 河南 7048.59 2874.67 5535.7 101.3
第五章 模型的建立与估计中的问题及对策
5.1 判断题(判断对错;如果错误,说明理由)
(1)尽管存在严重多重共线性,普通最小二乘估计量仍然是最佳线性无偏估计 量(BLUE)。
(2)如果分析的目的仅仅是为了预测,则多重共线性并无妨碍。
(3)如果解释变量两两之间的相关系数都低,则一定不存在多重共线性。 (4)如果存在异方差性,通常用的t 检验和F 检验是无效的。 (5)当存在自相关时,OLS 估计量既不是无偏的,又不是有效的。 (6)消除一阶自相关的一阶差分变换法假定自相关系数必须等于1。
(7)模型中包含无关的解释变量,参数估计量会有偏,并且会增大估计量的方 差,即增大误差。
(8)多元回归中,如果全部“斜率”系数各自经t 检验都不显著,则R2 值也高 不了。
(9)存在异方差的情况下,OLS 法总是高估系数估计量的标准误差。
(10)如果一个具有非常数方差的解释变量被(不正确地)忽略了,那么OLS 残差将呈异方差性。
5.2 考虑带有随机扰动项的复利增长模型: (1 ) , 0 t t t Y = Y + r u Y 表示GDP,Y0
是Y 的基期值,r 是样本期内的年均增长率,t 表示年份,t=1978,?,2003。 试问应如何估计GDP 在样本期内的年均增长率? 5.3 检验下列情况下是否存在扰动项的自相关。 (1) DW=0.81,n=21,k=3 (2) DW=2.25,n=15,k=2 (3) DW=1.56,n=30,k=5
5.4 有人建立了一个回归模型来研究我国县一级的教育支出: Y=β0+β1X1+β2X2+β3X3+u
其中:Y,X1,X2 和X3 分别为所研究县份的教育支出、居民人均收入、学龄儿 童人数和可以利用的各级政府教育拨款。
他打算用遍布我国各省、市、自治区的100 个县的数据来估计上述模型。 (1)所用数据是什么类型的数据?
(2)能否采用OLS 法进行估计?为什么?
(3)如不能采用OLS 法,你认为应采用什么方法? 5.5 试从下列回归结果分析存在问题及解决方法:
(1) i U? = 24.7747 + 0.9415 2i C - 0.0424 3i C R2 =0.9635 SE: (6.7525) (0.8229) (0.0807) 其中:Y=消费,X2=收入,X3=财产,且n=5000 (2) t Y? = 0.4529 - 0.0041t R2 =0.5284 t: (-3.9606) DW=0.8252
其中Y=劳动在增加值中的份额,t=时间
该估计结果是使用1949-1964 年度数据得到的。
5.6 工资模型:wi=b0+b1Si+b2Ei+b3Ai+b4Ui+ui
其中Wi=工资,Si=学校教育年限,Ei=工作年限,Ai=年龄,Ui=是否参加 工会。