第四章上机习题
C4.1 如下模型可以用来研究竞选支出如何影响选举结果:
voteA??0??1ln?expendA???2ln?expendB???3prtystrA?u
其中,voteA表示候选人A得到的选票百分数,expendA和expendB表示候选人A和B的竞选支出,而则是对A所在党派实力的一种度量(A所在党派在最近一次总统选举中获得的选票百分比)。 (1)如何解释?1? 解 在回归方程
voteA??0??1ln?expendA???2ln?expendB???3prtystrA?u
中,保持ln?expendB?、prtystrA 不变,可得:
?voteA??1?ln?expendA?.
因为100??ln?expendA??%?expendA,所以
?voteA??1?ln?expendA????1100???100??ln?expendA?? ???1100???%?expendA?所以?1100表示当expendA变动1%时vote变动多少个百分点。 注意:%?x?x2?x1?100,%?x表示x的百分数变化。 x1(2)用参数表示如下虚拟假设:A的竞选支出提高1%被B的竞选支出提高1%所抵消。
解 虚拟假设可以表示为
H0:?1???2或者H0:?1??2?0
(3)利用VOTE1.RAW中的数据估计上述模型,并以通常的方式报告结论。A的竞选支出或影响结果吗?B的竞选支出呢?你能用这些结论来检验第(2)部分中的假设吗?
解 估计方程为
voteA?45.079?6.083ln(expendA)?6.615ln(expendB)?0.152prtystrA??3.926??0.382?n?173,SSR?10052.14,R2?0.793?0.379??0.062?
从回归结果可知,ln?expendA?的系数估计值等于6.083,标准误等于0.382,t统计量为15.919,p值为0.0000。ln?expendB?的系数估计值等于-6.615,标准误等于0.379,t统计量为-17.463,p值为0.0000。由此可以看出ln?expendA?和ln?expendB?的斜率系数在非常小的显著性水平下都是统计上显著异于零,所以A的竞选支出和B的竞选支出都会影响竞选结果。在保持其他因素不变的情况下,若A的竞选支出增加10%,则A得到的选票百分数将提高约0.608个百分点;若B的竞选支出增加10%,则A得到的选票百分数将下降约0.662个百分点.
从以上叙述中我们知道,?1和?2的符号相反且都符合预期,重要程度相当,但是我们不能根据这些结论得出?1??2的标准误差,也就不能计算相应的t统计量,所以不能用这些结论来检验(2)中的假设。
(4)估计一个模型,使之能直接给出检验第(2)部分中假设所需要的t统计量。你有什么结论?(使用双侧对立假设)
解 令???1??2,则?1????2,把它代入原始的回归方程可得:
????voteA??0??ln?expendA???2?ln?expendB??ln?expendA????3prtystrA?u
利用VOTE1.RAW的数据重新估计以上方程,得到的估计方程为
voteA?45.079?0.532ln?expendA??6.615?ln?expendB??ln?expendA???0.152prtystrA??3.926??0.533?n?173,SSR?10052.14,R2?0.793??0.379??0.062????????0.532,se????0.533, 从回归结果可知,?的t统计量为-0.998,p值为0.3196,??所以对?所做的估计在5%的显著性水平下是不显著的,我们不能在5%的显著性水平上拒绝虚拟假设H0:?1??2?0。
比较(3)和(4)可以看到:两估计方程截距、prtystrA的斜率估计值及其标准误都
是相同的,(4)中新变量ln?expendB?-ln?exp(3)中ln?eendA?的系数和标准误与xpendB??2的系数和标准误相同,两估计方程的SSR,R都是相同的。此外,(3)中的?1也可以根
据?2和?计算得出。
C4.2 本题要用到LAWSCH85.RAW中的数据。
(1)使用与习题3.4一样的模型,表述并检验虚拟假设:在其他条件不变的情况下,法学院排名对起薪中位数没有影响。
解 由题意可知,我们构造回归模型如下
??ln?salary???0??1rank??2lsat??3gpa??4ln?libvol???5ln?cost??u
则虚拟假设可以表述为H0:?1?0
利用LAWSCH85.RAW的数据可得估计方程为
ln?salary??8.343?0.00333rank?0.00470lsat?0.248gpa??0.533??0.000348??0.0333?n?136,R2?0.842?0.00401??0.090?
?0.0950ln?libvol??0.0376ln?cost??0.0321????从回归结果可以看出,rank斜率估计值?1??0.00333,se??1??0.000348,t统计
???量为-9.541,p值等于0.0000,由此可知rank即使是在很小的显著性水平上也是统计显著的,所以我们完全有理由拒绝H0。
(2)新生年级的学生特征(lsat,gpa)对解释salary而言是个别或者联合显著的吗?
解 从(1)的估计方程可知,lsat的t统计量为1.171,p值等于0.2437;gpa的t统计量为2.749,p值等于0.0068。所以在5%的显著性水平上只有gpa是个别显著的。
为了说明lsat,gpa是不是联合显著的,我们做如下的虚拟假设:
H0:?2?0,?3?0
其对立假设为H1:?2,?3不全为零。(1)已经给出了不受约束模型的估计方程,受约束模型的估计方程如下:
ln?salary??9.880?0.00417rank?0.129ln?libvol??0.0265ln?cost???0.343??0.000298?n?141,R2?0.822?0.0325??0.0295?
两个模型的样本容量不同,是由lsat,gpa的数据缺失造成的。不受约束模型中
22Rur?0.841,受约束模型的Rr?0.822,n?136,k?5,q?2,由此可得:
q0.841?0.822130ur?RrF????7.767 21?0.8412??1?Rurn?k?1??R22??分子自由度为2,分母自由度为130,显著性水平为5%的F统计量的临界值为3.00,,所以lsat,gpa在5%的显著性水平上是联合显著的。
(3)检验要不要在方程中引入入学年级的规模(clsize)和教职工的规模(faculty);只进行一个检验。
解 回归模型如下
ln?salary???0??1rank??2lsat??3gpa??4ln?libvol???5ln?cost???6clsize??7faculty?u再次利用LAWSCH85.RAW的数据得到其估计模型为
ln?salary??8.416?0.00343rank?0.00558lsat?0.266gpa??0.552??0.000357??0.0404?n?131,R2?0.844?0.00418??0.0932??0.000154??0.00040??0.0552ln?libvol??0.0296ln?cost??0.000134clsize?0.0000675faculty
?0.0347? 回归样本容量为131,这是受到clsize和faculty数据缺失的影响。
从回归结果可知,clsize和faculty的t统计量的值分别为0.875、0.169,p值分别为 0.383、0.866。由此可知,在5%,甚至是10%的显著性水平上clsize和faculty在统计上都不显著。
以(1)中的模型为受约束模型,本题中的模型为不受约束模型,就可以检验clsize和
22faculty的联合显著性了。Rur?0.844,受约束模型的Rr?0.842,n?131,k?7,
q?2,由此可得:
q0.844?0.842123ur?RrF????0.788 21?0.84421?Rur?n?k?1???R22?? 分子自由度为2,分母自由度为123,显著性水平为5%的F统计量的临界值为3.00,,lsat,gpa在5%的显著性水平上是联合显著的,所以不应该把clsize和faculty放进模型中。
(4)还有哪些因素可能影响到法学院排名,但又没有被包括在薪水回归中? 解 教师质量、性别差异、种族差异、学生能力测试成绩等。 C4.3 参考习题3.14,现在我们使用住房价格的对数作为因变量:
ln?price???0??1sqrft??2bdrms?u
(1)你想在住房增加一个150平方英尺的卧室的情况下,估计并得到price变化百分比的一个置信区间。以小数形式表示就是?1?150?1??2。使用HPRICE1.RAW中的数据去估计?1。
解 使用HPRICE1.RAW中的数据得到估计方程为
ln?price??4.766?0.000379sqrft?0.0289bdrms??0.097??0.0000432?n?88,SSR?3.3,R2?0.588???0.0296?
由以上回归结果可知,?1?0.000379,?2?0.0289,所以
?1?150?0.000379?0.289?0.08575
这意味着增加一个150平方英尺的卧室的情况下,price预期大约增长8.6%。 (2)用?1和?1表达?2,并代入ln?price?的方程。
解 ?1?150?1??2??2??1?150?1,代入方程可得:
?