要求对下列两种情况分别估计利润模型:
(1)如果认为季度影响使利润平均值发生变异,应如何引入虚拟变量? (2)如果认为季度影响使利润对销售额的变化率发生变异,如何引入虚拟变量? 答案:
1、在建立回归模型过程中,被解释变量不仅受到定性解释变量的影响,有时还受到一些非定量解释变量(如职业、性别、地区、季节等)的影响,他们不能用数值计量,称为虚拟变量,习惯上,其取值通常为0或1。虚拟变量是一种离散结构的量,是用来描述所研究变量的发展或变异而建立的一类特殊变量。
2、(1) 虚拟变量的设定将使不同的商店的差别保存固定。如连锁商店将是折扣商店的10倍,简易商店将是折扣商店的100倍。这个种设定并不是合适的。 (2)不同商店类型的参数不是显著异于零的,其p值为0.55。
通过样本,我们发现:与我们预期的一样,有优质标志比没有优质标志的可乐贵;小瓶装的要比大瓶的贵。这个模型解释了每盎司可乐价格变异的60.33%。 (3) 虚拟变化很好解释了小瓶装和大瓶装的对可乐价格的影响。
3、答:如果一个定性变量含有k个类别,一般只能设k?1个虚拟变量,以避免多重共线性。 4、(1)模型A斜率表示若咖啡价格上升1美元,每人每天消费杯数将下降0.4795杯。模型B的斜率给出消费杯数对咖啡价格的弹性。 (2) 0.2190(3)-0.253(4)是缺乏弹性。(5)截距表示咖啡价格为1时,每人每天消费EXP0.774杯。
5、(1)D1的参数的经济含义为:当销售收入与公司股票收益保持不变时,金融业的CEO要比交通运输业的CEO多获15.8个百分点的薪水。其它两个可类似解释。
(2)公共事业和交通运输业之间估计薪水的近似百分比差异就是以百分数的解释的D3的参数,即为:28.3%。由于参数t的统计值为-2.895,它大于1%的显著水平下自由度为203的t分布的临界值1.96,因此这种差异是统计上显著的。
(3)由于消费品工业和金融业相对于交通运输业的薪水百分比差异分别为15.8%与18.1%,因此他们之间的差异为:18.1%-15.8%=23.%。
6、(1)对利润函数Y??0??1X??按加法方式引入虚拟变量:D1D2D3:
Y??0??1D2??2D3??2D4??1X??
其中D1=(1=第二季度,0=其它季度) D2=(1=第三季度,0=其它季度)
D3=(1=第四季度,0=其它季度)
运用EWievs软件即有如下的估计模型:
??6685Y.8?1322.5D2?218.2D3?182.2D4?0.0038X
(3.81) (2.07) (-0.35) (0.28) (3.33)
R2?0.5256,F=5.26, D.W.=0.388
回归结果表明,只有销售额与第二季度对利润有显著影响。
由于其它季度的影响不显著,故可引入第二季度虚拟变量D2,得如下回归:
??6513Y.1?1331.6D2?0.0393X
(4.01) (2.7) (3.72)
R2?0.5156 F=11.17, D.W.=0.470
(2)如果季度因素对利润产生影响,则可按乘法方式引入虚拟变量:
Y??0??1D2X??2D3X??2D4X??1X??,运用EWievs软件运算结果可以看
出,仍然是第二季度对利润有影响,其它季度的影响不显著,因此只引入第二季度虚拟变量,得如下回归结果:
??6839Y.2?0.0087D2X?0.0372X
(4.23) (2.76) (3.51)
R2?0.5208,F=11.41, D.W.=0.485
由此可知,在其它季度,利润为0.0372。第二季度则增加到0.0459。
第五章 异方差性习题与答案
1、产生异方差的后果是什么?
2、下列哪种情况是异方差性造成的结果? (1)OLS估计量是有偏的
(2)通常的t检验不再服从t分布。 (3)OLS估计量不再具有最佳线性无偏性。 3、已知模型:Yi??0??1X1i??2X2i?ui
式中,Yi为某公司在第i个地区的销售额;X1i为该地区的总收入;X2i为该公司在该地区投入的广告费用(i=0,1,2??,50)。
(1)由于不同地区人口规模Pi可能影响着该公司在该地区的销售,因此有理由怀疑随机误差项ui是异方差的。假设?i依赖于总体Pi的容量,逐步描述你如何对此进行检验。需说明:A、零假设和备择假设;B、要进行的回归;C、要计算的检验统计值及它的分布(包括自由度);D、接受或拒绝零假设的标准。
(2)假设?i??Pi。逐步描述如何求得BLUE并给出理论依据。 4、下表数据给出按学位和年龄划分的经济学家的中位数工薪:
表1 经济学家的工资表
年 龄 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64 65-69
中位数工薪(以千美元计算) 硕士 8.0 9.2 11.0 12.8 14.2 14.7 14.5 13.5 12.0
博士 8.8 9.6 11.0 12.5 13.6 14.3 15.0 15.0 15.0
(1)有硕士学位和有博士学位经济学家的中位数工薪的方差相等么? (2)如果相等,你会怎样检验两组平均中位数工薪相等的假设?
(3)在年龄35至5岁之间的经济学家,有硕士学位的比有博士学位的赚更多的钱,那么你会怎样解释这一发现?
5、为了解美国工作妇女是否受到歧视,可以用美国统计局的“当前人口调查”中的截面数据,研究男女工资有没有差别。这项多元回归分析研究所用到的变量有: W—雇员的工资率(美元/小时) 1表示雇员为女性, 0表示女性意外的雇员。ED:受教育的年数。AGE:年龄
对124名雇员的样本进行的研究得到回归结果为:(括号内为估计的t值)
???6.41?2.76sex?0.99ED?0.12AGE R2?0.867 E?23.2 W求:(1)该模型调整后的决定系数R (2)各估计值的标准差为多少?
(3)检验美国工作妇女是否受到歧视,为什么?(4)按此模型预测一个30岁受教育16年的美国男性的平均每小时的工作收入为多少美元?
6、下表给出了2000年中国部分省市城镇居民每个家庭平均全年可支配收入X与消费支出Y的统计数据。
(1)试用OLS法建立居民人均消费支出与可支配收入的线性模型。 (2)检验模型是否存在异方差性;
2地区 可支配收入 X 消费性支出Y 地区 可支配收入 X 消费性支出Y 北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 答案:
10349.69 8140.50 5661.16 4724.11 5129.05 5357.79 4810.00 4912.88 11718.01 6800.23 8493.49 6121.04 4348.47 3941.87 3927.75 4356.06 4020.87 3824.44 8868.19 5323.18 浙江 山东 河南 湖北 湖南 广东 陕西 甘肃 青海 新疆 9279.16 6489.97 4766.26 5524.54 6218.73 9761.57 5124.24 4916.25 5169.96 5644.86 7020.22 5022.00 3830.71 4644.50 5218.79 8016.91 4276.67 4126.47 4185.73 4422.93 1、(1)参数估计量仍然是线性无偏的,但不是有效的。(2)建立在t分布和F分布之上的检验失效。(3)估计量的方差增大,预测精度下降。
2、第(2)与(3)种情况可能由于异方差性造成。异方差性并不会引起OLS估计量出现偏误。
3、(1)如果?i依赖于总体Pi的容量,则随机扰动项的方差?i2依赖于Pi2。因此,要进行
2的回归的一种形式为?i2??0??1Pi??i。于是,要检验的零假设H0:?1?0,备择假
设H1:?1?0。检验步骤如下:
~2; 第一步:使用OLS方法估计模型,并保存残差平方项ei~2对常数项C和P2的回归 第二步:做eii第三步:考察估计的参数?1的t统计量,它在零假设下服从自由度为2的t分布。 第四步:给定显著性水平面0.05(或其他),查相应的自由度为2的t分布的临界值,
?1的t统计值大于该临界值,则拒绝同方差的零假设。 如果估计的参数?YiXXu1??0??11i??22i?iPiPi22Pi2PiPi由于Var(ui/Pi)??i/Pi??,所以在该变换模型中可以使用OLS方法,得出BLUE估
计值。方法是对Yi/Pi关于1/Pi、X1i/Pi、X2i/Pi做回归,不包括常数项。
4、(1) 用Bartlett检验,?检验统计量时0.0019,?值是0.965,因此样本方差在统计上是相等的
(2) 因为两个变量没有统计上的不同,要检验两组的平均薪水是否统计上相同,可以用t检验。计算得出的t值时0.437,鉴定的t值是t(0.05,16)?2.120,因此,两个样本薪水平均在统计上相等的
(3) 有很多因素可以解释这些,关键因素可能是雇主的特性。
2(2)假设?i??Pi时,模型除以Pi有:
5、(1) R2?1?(1?R2)(2) 估计值 t-值 标准差 n?1123?1?(1?0.867)?0.86n?k120-2.76 -4.61 0.60 0.99 8.54 0.12 0.12 4.63 0.026 -6.41 -3.38 1.90 (3)考虑零假设:美国工作妇女没有受到歧视,检验统计量t=-4.61,根据自由度为120的t-分布临界值表,检验统计量的值大于0.1%的水平下的临界值3.16,因此,我们有足够的证据拒绝零假设,认为美国工作妇女受到性别歧视。 (4)E(w)??6.41?2.76?0?0.99?16?0.12?30?13.03 6、(1)运用EWives软件计算得模型为: Y=0.755125X+272.3635
(2)在5%的显著水平下,自由度为(6,6)的F分布的临界值为F0.05(6,6)?4.28。拒绝无异方差性假设,表明原模型存在异方差性。
第六章 序列相关性习题与答案
1、对于线性回归模型,随机扰动项u产生序列相关的原因有哪些? 2、DW检验的局限性主要有哪些? 3、检验序列相关性的方法思路是什么?
4、在研究生产中的劳动在加值(value added)中所占分额(即劳动份额)的变动时,古扎拉蒂考虑如下模型:
模型A: Yt=β0+β1t+ut 模型B:Yt=α0+α1t+α2t+ ut
其中Y=劳动份额,t=时间。根据1949—1964年数据,对初级金属工业得到如下结果: 模型A: Yt= 0.4529—0.0041t R2=0.5284 d=0.8252 (-3.9608) 模型B:Yt=0.4786-0.0127t+0.0005t R2=0.6629 d=1.82 其中括弧中的数字是t比率。
(1) 模型A中有没有序列相关?模型B呢? (2) 怎样说明序列相关?
(3) 你会怎样区分“纯粹”自相关和设定偏误? 5、判明一下陈述的真伪,简单地申述你理由。
(1)当自相关出现时,OLS估计量时偏误的和非有效的, (2)德宾—沃森d检验假定误差项ui的方差有同方差性。 (3)用一阶差分变换消除自相关时,假定自相关系数Ρ为-1。
(4)如果一个是一阶差分形式的回归,而另一个是水平形式的回归,那么,这两个模
2
2