步骤五:建立ECM模型。
DLNEX = 0.757*DLNIM - 0.458*ET(-1) R2=0.618 t:
(12.23)
(-4.54) DW=1.788
方程的回归系数通过了显著性检验,误差修正系数为负,符合反向修正机制。关于ECM模型dlnex的实际值、拟合值和残差的拟合图如下:
0.60.40.20.30.20.10.0-0.1-0.2556065707580859095Fitted000.0-0.2-0.4-0.6ResidualActual
8.11 答案略。
第九章 面板数据模型
9.1 表面不相关回归的含义是,所涉及的各个回归似乎不相关,但实际上相关。 这种相关在数学上表现为各个回归方程扰动项之间的相关,即扰动项跨方程相关。 表面不相关回归的步骤是:
1.用OLS法分别估计每个方程,计算和保存回归中得到的残差; 2.用这些残差来估计扰动项方差和不同回归方程扰动项之间的协方差;
3.上一步估计的扰动项方差和协方差被用于执行广义最小二乘法,得到各方程系数的估计值。
9.2 当不同的横截面种类的截距之间的差异被认为是固定的而不是随机的情况下,应采用固定影响模型。如果横截面个体是随机地被选择出来以代表一个较大的总体,则采用随机影响模型比较合适。随机影响模型与固定影响模型一样,允许不同横截面种类的截距不同,但这种不同被认为是随机的,而不是固定的。
9.3 随机影响模型的扰动项不再满足普通最小二乘法各期扰动项相互独立的假设,扰动项
31
的一个分量在各期都相同。
9.4 并不总是。尽管将数据合在一起将增加自由度,但有时采用混合数据也是不合适的。如果不同横截面单元的斜率系数不同的话,则最好是分别回归。如果试图通过使用斜率虚拟变量来解决不同横截面单元不同斜率系数的问题,需要假定扰动项方差为常数。而采用分别回归,每个回归的扰动项方差可以不同,也就是每个横截面单元的扰动项方差不同。
9.5 随机系数模型是指每个横截面个体的解释变量对被解释变量的影响是不随时间变化的确定性关系,但随着横截面个体的不同而不同,且这种影响在横截面个体之间的差异的变动是随机的。
动态面板数据模型是指通过滞后结构将时间维引入面板数据模型。 9.6 (1)OLS回归结果:
??3919.18?32.00empY1tt:R21t?722.78otm1t(2.08)(2.30)?0.67(6.03)
?e2t?17,825,726
???49122.54?135.50empY2tt:R22t?2646.568otm(2.43)2t(?14.74)?0.99(20.21)
?et2?40,564,183
??-14074.88?81.15empY3tt:R23t?3450.41otm(4.04)3t(?1.1)?0.66(3.91)
?e2t?1.78E?08
??6812.03?48.97empY4tt:R24t?2860.79otm(4.68)4t(1.24)?0.84(9.40)
?e2t?30,518,397
SUR回归结果:
??Y1t5367.24?27.45EMP1t?477.13OTM1t(3.76)2 t:(5.97)(1.62)2t
R?0.66??Y2tt:?e?18,664,338?51,963.17?142.87EMP2t?1704.48OTM2t(?17.33)R?0.992(24.43)(1.77)
?e2t?43,356,773 32
???4479.77?69.05EMP?2976.12OTMY3t3t3tt:(?0.40)2(3.80)(3.81)2t
8R?0.64?e?1.85?10
??3596.00?52.05EMP?3140.84OTMY4t4t 4tt:(0.74)(11.18)(5.77)
22R?0.835et?31,122,367?
将两组回归结果比较,可见两组结果的斜率估计值不一样,t统计量也是。SUR估计值与OLS估计值之所以不同,是因为表面不相关回归考虑了各回归方程扰动项的相关,而普通最小二乘法分别估计每个方程,不考虑不同回归方程扰动项之间的任何相关。
(2)固定影响模型估计结果如下:
??-17758.2?92.20emp?4644.36otm Y1t1t1t??-18694.9?92.20empY2t??-26683.9?92.20empY3t??-29949.1?92.20empY4t4t2t?4644.36otm?4644.36otm2t
3t3t?4644.36otm4t
随机模型估计结果:
???22829.99?91.54empYitt:R2it?4627.11otm(9.09)it(?3.99)?0.83(18.00)
?e2t?804,299,968四个产业截距的均值为-22829.99,各个产业与截距均值的差异如下: 产业1: 5179.61 产业2: 4744.61
产业3: -3360.03 产业4: -6564.19
EViews6豪斯曼检验结果如下:
Correlated Random Effects - Hausman Test Pool: CHANYE Test cross-section random effects
Chi-Sq. Test Summary Cross-section random
Statistic
0.352189
Chi-Sq. d.f. 2
Prob. 0.8385 H0:?i与Xit不相关H1:?i与Xit相关 33
豪斯曼检验统计量m=0.35,其p值=0.84>显著性水平0.05,则接受原假设,即产业模型应设定为随机影响模型。
9.7 可以。在估计固定影响模型时,采用组内估计法,而不是最小二乘虚拟估计法,则不会损失太多的自由度,其回归的自由度为94;如果你分别运行两个回归,每年一个,每个回归的自由度是44。这表明将数据合在一起得到了更多的自由度。
9.8 问题可通过使用一个F检验来回答,但最容易的方法是采用两年的混合数据估计下面
的回归方程:
DVDEXP = β0 +β1INCOME +β2PRICE +β3RAINFALL +β4YEAR2 + u
其中YEAR2=1,若观测值来自第二年的数据;0,其它 回归结果如下:
Dependent Variable is DVDEXP Variable Constant INCOME PRICE RAINFALL YEAR2
Observations: 24 R2 = 0.79
Adjusted R2 = 0.74
Residual Sum of Squares = 4877.24 F-statistic = 18.18
对β4进行t检验显示,YEAR2统计上不显著,表明不需要固定效应模型。由于仅有两年的数据,因而可以用t检验来替代F检验,检验是否需要固定效应模型。
Coefficient 86.04
0.06 -3.20 7.46 -5.21
Standard Error
24.39 0.01 0.90 2.40 6.59
t-Statistic
3.53 6.22 -3.57 3.11 -0.79
p-Value 0.00 0.00 0.00 0.01 0.44
第十章 定性选择模型
10.1 一般来说,普通最小二乘法不是估计定性选择模型的好方法,这是因为OLS假定因变量和自变量之间存在线性关系,但是对于定性选择模型,二者关系通常不是线性的。具体说来,有以下三个问题:
(1)因变量拟合值代表概率,但它们常常小于0或大于1,而概率值是不可能取这类值的; (2)往往存在异方差性;
(3)扰动项不服从正态分布。
10.2 没有问题。两种方法得到的斜率估计值不同是因为估计方法不同。Probit估计是基
34
于累积正态概率分布,而logit估计是基于累积logistic分布。
10.3 (1) 不是。拟合值0.48的含义是,考虑家庭的收入、孩子的数目以及房价等因素,
该家庭将买房的概率估计值为0.48;
(2)不会。因为估计的概率小于0.5,因此预测为0。
(3)若该家庭买了房,不会惊讶。因为买房的估计概率接近0.5,0.48仅仅是估计概
率。同时,即便估计值完全正确,它也只是个概率。如果估计概率是0.9,我们预
测该家庭将买房,但我们仍有10%的错误机会:该家庭继续租房。
10.4 用牛顿法估计模型,结果如下(括号中数字为标准误差):
???0.51274?0.15964XY(1.042)(0.202)
Log?likelihood??6.403,约束Log?likelihood??6.9315检验原假设的t值为0.15964/0.202 = 0.79,似然比检验(LR检验)的?2值为
-2ln???2[?6.9315?(?6.403)]?1.057
二者都没有大到可以拒绝原假设,因此我们接受原假设,即X对于决定Y等于1的概率无影响。
?1;样 10.5 设样本数为n,则样本取值为1的个数为nY,预测正确的个数为nYq?0。则整体的正确预测 本取值为0的个数为n(1?Y),预测正确的个数为n(1?Y)q百分数:
??p?0?nYq?1n(1?Y)qn?0?Yq?1 ?(1?Y)q10.6 主要区别是:Censored模型和Truncated模型处理特殊类型的缺失数据问题,在
Censored模型中,因变量在一个分界点之上或之下被删减;Truncated模型则处理总体的一部分被完全排除的情况:我们观测不到抽样模式所未包括的那些单元的信息,这是样本选择问题的一个特例。
10.7 门票卖光的情况反映了该场比赛的门票需求超过了球场的容量。可考虑将这些观测值看作是Tobit模型中的受限观测值。
10.8 (1)全部20个观测值的均值是4.18222,该值将高估?。因为所有负值都已转换为0,而若有这些负值的数据的话,则估计量应包含正值和负值,现在每个负Y*都用0替代,从而大于真实的Y*,这将增大估计量。
(2)对于14个非0观测值,样本均值为(20/14)4.1822 = 5.9746。与(1)中情况类似,该值将高估?。我们这里计算的均值是截断均值,全样本中可能包含一些负值,而观测到的样本则不包含负值,同样会导致均值的高估。
(3)Tobit模型的对数似然如(10.29)所示,对于本题中仅有常数项的情形,对数似然为:
35
lnL??n12[ln(2?)?ln?]?212?2?(yyi?0i??)?2?ln?(??/?)
yi?0其中n1为非0观测值的个数。
36