stata学习笔记(2)

2019-03-22 23:11

. newey consumption temp price income,lag(3)Regression with Newey-West standard errors Number of obs = 30maximum lag: 3 F( 3, 26) = 27.63 Prob > F = 0.0000 Newey-West consumption Coef. Std. Err. t P>|t| [95% Conf. Interval] temp .0034584 .0004002 8.64 0.000 .0026357 .0042811 price -1.044413 .9772494 -1.07 0.295 -3.053178 .9643518 income .0033078 .0013278 2.49 0.019 .0005783 .0060372 _cons .1973149 .3378109 0.58 0.564 -.4970655 .8916952

上图显示标准误与OLS标准误无多大区别,因此将滞后阶数增加为6,

. newey consumption temp price income,lag(6)Regression with Newey-West standard errors Number of obs = 30maximum lag: 6 F( 3, 26) = 52.97 Prob > F = 0.0000 Newey-West consumption Coef. Std. Err. t P>|t| [95% Conf. Interval] temp .0034584 .0003504 9.87 0.000 .0027382 .0041787 price -1.044413 .9821798 -1.06 0.297 -3.063313 .9744864 income .0033078 .00132 2.51 0.019 .0005945 .006021 _cons .1973149 .3299533 0.60 0.555 -.4809139 .8755437

从上图可以看到无论截断参数是3还是6,标准误都变化不大,比较稳健。

此外,前面提到自相关存在可能是因为模型设定不正确,因此考虑在解释变量中加入temp的滞后值,然后再进行OLS回归:

. reg consumption temp L.temp price income Source SS df MS Number of obs = 29 F( 4, 24) = 28.98 Model .103387183 4 .025846796 Prob > F = 0.0000 Residual .021406049 24 .000891919 R-squared = 0.8285 Adj R-squared = 0.7999 Total .124793232 28 .004456901 Root MSE = .02987 consumption Coef. Std. Err. t P>|t| [95% Conf. Interval] temp --. .0053321 .0006704 7.95 0.000 .0039484 .0067158 L1. -.0022039 .0007307 -3.02 0.006 -.0037119 -.0006959 price -.8383021 .6880205 -1.22 0.235 -2.258307 .5817025 income .0028673 .0010533 2.72 0.012 .0006934 .0050413 _cons .1894822 .2323169 0.82 0.423 -.2899963 .6689607然后使用BG检验是否存在自相关:

. estat bgoBreusch-Godfrey LM test for autocorrelation lags(p) chi2 df Prob > chi2 1 0.120 1 0.7292 H0: no serial correlation

结果显示无自相关,而后DW值也改进为1.58,因此修改模型后扰动项基本不再存在自相关。

模型设定与数据问题

遗漏变量:被解释变量可能被加入到扰动项中

解决方式:加入尽可能多的控制变量;使用代理变量;工具变量法;使用面板数据;随机试验或自然实验。

其中代理变量应满足两个条件:多余性,仅通过影响遗漏变量而作用于被解释变量;剩余独立性,遗漏变量中不受代理变量影响的剩余部分与所有解释变量均不相关。

多重共线性:某一解释变量可以由其他解释变量线性表出,即存在多重共线性。 检测:先回归,然后estat vif VIF低于10即不存在多重共线性。

工具变量,2SLS与GMM

工具变量的适用条件:OLS成立的最重要条件是解释变量与扰动项不相关,如出现相关可以使用工具变量法来解决。其中在计量经济学中,将所有与扰动项相关的解释变量成为内生变量,一个有效的工具变量应满足一下两个条件:1、工具变量与内生解释变量相关;2、工具变量与扰动项不相关。

过程:传统的工具变量法一般通过二阶段最小二乘法(2SLS或TSLS)来实现:1、用内生解释变量对工具变量进行回归,得到拟合值Pt(Pt实际上是内生变量中的外生部分,而另一部分是与扰动项相关);2、用被解释变量对第一阶段的拟合值Pt进行回归。 工具变量的检测:1、不可识别检验;2、弱工具变量检验;3、过度识别检验(estat overid)。 豪斯曼检验:原假设为所有解释变量均为外生变量,若拒绝假设的话应该使用工具变量法,若接受的话使用OLS。 豪斯曼过程:reg X1 x2

Estimates store ols(存储OLS的结果)

Ivregress 2sls y x1(x2=z1 z2)(假设怀疑X2为内生变量) Estimates store iv(存储2SLS结果)

Hausman iv ols,constant sigmamore(根据存储的结果进行豪斯曼检验)

若存在异方差的问题,则可以使用杜宾-吴-豪斯曼检验。它在异方差的情况下也适用。

在球形扰动项的假定下,2SLS最有效,但如果扰动项存在异方差或自相关,则存在GMM广义矩估计这一更有效的方法:首先使用2SLS得到残差,然后GMM,但是在实际操作中使

用迭代法。

GMM的命令:

ivregress gmm y x1(x2=z1 z2) 两步最优GMM

ivregress gmm y x1 (x2=z1 z2),igmm 迭代GMM estat overid 过度识别检验

工具变量法的STATA命令和实例: Use grilic.dta,clear Sum

然后考察智商和受教育年限的相关关系(本文研究的是工资与受教育年限的关系)

. pwcorr iq s,sig iq s iq 1.0000 s 0.5131 1.0000 0.0000

具有较强的正相关关系。

然后作为一个参照系,进行OLS回归并使用稳健标准误。

. reg lw s expr tenure rns smsa,rLinear regression Number of obs = 758 F( 5, 752) = 84.05 Prob > F = 0.0000 R-squared = 0.3521 Root MSE = .34641 Robust lw Coef. Std. Err. t P>|t| [95% Conf. Interval] s .102643 .0062099 16.53 0.000 .0904523 .1148338 expr .0381189 .0066144 5.76 0.000 .025134 .0511038 tenure .0356146 .0079988 4.45 0.000 .0199118 .0513173 rns -.0840797 .029533 -2.85 0.005 -.1420566 -.0261029 smsa .1396666 .028056 4.98 0.000 .0845893 .194744 _cons 4.103675 .0876665 46.81 0.000 3.931575 4.275775

教育投资率10.26%,显然过高,可能是遗漏了变量能力,使得能力对工资的贡献也被纳入教育的贡献。

因此使用iq作为能力的代理变量,再进行OLS回归,可以发现加入iq作为能力的代理变量后,教育投资回报率降低了一些,但还是过高。(如下图)

. reg lw s iq expr tenure rns smsa,rLinear regression Number of obs = 758 F( 6, 751) = 71.89 Prob > F = 0.0000 R-squared = 0.3600 Root MSE = .34454 Robust lw Coef. Std. Err. t P>|t| [95% Conf. Interval] s .0927874 .0069763 13.30 0.000 .0790921 .1064826 iq .0032792 .0011321 2.90 0.004 .0010567 .0055016 expr .0393443 .0066603 5.91 0.000 .0262692 .0524193 tenure .034209 .0078957 4.33 0.000 .0187088 .0497092 rns -.0745325 .0299772 -2.49 0.013 -.1333815 -.0156834 smsa .1367369 .0277712 4.92 0.000 .0822186 .1912553 _cons 3.895172 .1159286 33.60 0.000 3.667589 4.122754

使用iq来度量能力存在测量误差,因此iq为内生变量,考虑使用med kww mrt age作为iq的工具变量,进行2SLS回归 ,并使用稳健标准误。

. ivregress 2sls lw s expr tenure rns smsa (iq=med kww mrt age),rInstrumental variables (2SLS) regression Number of obs = 758 Wald chi2(6) = 355.73 Prob > chi2 = 0.0000 R-squared = 0.2002 Root MSE = .38336 Robust lw Coef. Std. Err. z P>|z| [95% Conf. Interval] iq -.0115468 .0056376 -2.05 0.041 -.0225962 -.0004974 s .1373477 .0174989 7.85 0.000 .1030506 .1716449 expr .0338041 .0074844 4.52 0.000 .019135 .0484732 tenure .040564 .0095848 4.23 0.000 .0217781 .05935 rns -.1176984 .0359582 -3.27 0.001 -.1881751 -.0472216 smsa .149983 .0322276 4.65 0.000 .0868182 .2131479 _cons 4.837875 .3799432 12.73 0.000 4.0932 5.58255 Instrumented: iqInstruments: s expr tenure rns smsa med kww mrt age

受教育年限回报上升,而iq竟然是负相关,因此不可信,使用工具变量法需要验证其工具变量的有效性因此进行过度识别来检验所有工具变量是否外生。

. estat overid Test of overidentifying restrictions: Score chi2(3) = 51.5449 (p = 0.0000)

上图显示有些工具变量不合格,与扰动项相关。怀疑mrt和age不满足外生性,因此仅适用med和kww作为iq的工具变量,再次进行2SLS回归,同时显示第一阶段的回归结果。

. ivregress 2sls lw s expr tenure rns smsa (iq=med kww),r firstFirst-stage regressions Number of obs = 758 F( 7, 750) = 47.74 Prob > F = 0.0000 R-squared = 0.3066 Adj R-squared = 0.3001 Root MSE = 11.3931 Robust iq Coef. Std. Err. t P>|t| [95% Conf. Interval] s 2.467021 .2327755 10.60 0.000 2.010052 2.92399 expr -.4501353 .2391647 -1.88 0.060 -.9196471 .0193766 tenure .2059531 .269562 0.76 0.445 -.3232327 .7351388 rns -2.689831 .8921335 -3.02 0.003 -4.441207 -.938455 smsa .2627416 .9465309 0.28 0.781 -1.595424 2.120907 med .3470133 .1681356 2.06 0.039 .0169409 .6770857 kww .3081811 .0646794 4.76 0.000 .1812068 .4351553 _cons 56.67122 3.076955 18.42 0.000 50.63075 62.71169 Instrumental variables (2SLS) regression Number of obs = 758 Wald chi2(6) = 370.04 Prob > chi2 = 0.0000 R-squared = 0.2775 Root MSE = .36436 Robust lw Coef. Std. Err. z P>|z| [95% Conf. Interval] iq .0139284 .0060393 2.31 0.021 .0020916 .0257653 s .0607803 .0189505 3.21 0.001 .023638 .0979227 expr .0433237 .0074118 5.85 0.000 .0287968 .0578505 tenure .0296442 .008317 3.56 0.000 .0133432 .0459452 rns -.0435271 .0344779 -1.26 0.207 -.1111026 .0240483 smsa .1272224 .0297414 4.28 0.000 .0689303 .1855146 _cons 3.218043 .3983683 8.08 0.000 2.437256 3.998831 Instrumented: iqInstruments: s expr tenure rns smsa med kww

如上图,第一部分回归是使用内生解释变量对工具变量进行回归,第二部分用被解释变量对第一阶段回归的拟合值进行回归。

上图中教育回报率较为合理,而且iq系数也为整数,再次进行过度识别检验。

. estat overid Test of overidentifying restrictions: Score chi2(1) = .151451 (p = 0.6972)

结果没有拒绝外生的原假设。


stata学习笔记(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:新版人教版一年级语文下册.四个太阳教案

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: