第7讲 线性回归的后续估计命令

2018-11-12 21:07

第7讲回归诊断

regress postestimation — Postestimation tools for regress(回归的后续估计工具)

常用的后续估计命令:

命令

描述

dfbeta

estat hettest estat imtest estat ovtest estat szroeter estat vif

estat esize DFBETA影响统计量 异方差检验 信息矩阵检验

对于遗漏变量的拉姆齐回归设定误差检验 对于异方差的Szroeter秩检验 自变量的方差膨胀因子 η2和ω2效应大小

Description

估计的对比和ANOVA-style的联合检验

赤池与施瓦茨的贝叶斯信息准则(AIC and BIC) 估计样本的概要统计

估计量的方差-协方差矩阵(VCE)

postestimation statistics for survey data cataloging estimation results 动态预测和模拟 Hausman的设定检验

系数的线性组合的点估计、标准误差、检验和推断 模型设定的link检验 似然比检验

边际均值、预测性边际、边际效应和平均边际效应

graph the results from margins (profile plots, interaction plots, etc.) 系数的非线性组合的点估计、标准误差、检验和推断 预测、残差、影响统计量和其他诊断工具 广义预测的点估计、标准误差、检验和推断 估计的两两比较 似不相关估计

简单和复合线性假设的Wald检验 非线性假设的Wald检验

标准的后续估计命令:

Command contrast estat ic

estat summarize estat vce estat (svy) estimates forecast hausman lincom linktest lrtest margins marginsplot nlcom predict predictnl pwcompare suest test testnl

predict的命令语句

1

predict [type] newvar [if][in] [, statistic]

predict选项

statistic xb residuals score rstandard rstudent cooksd leverage 或 hat pr(a,b) e(a,b) ystar(a,b) 描述 计算线性预测值,默认选项 计算残差 计算得分,在线性回归中等于残差 计算标准化的残差 计算学生化残差(Studentized (jackknifed)) 计算Cook的D影响统计量 计算杠杆(投影矩阵(帽矩阵)的对角元素) 计算Pr(????|a

predict newvar,cooksd (Cook的D影响统计量) predict newvar,resid (残差)

predict newvar,rstandard (标准化残差)

predict newvar,stdf (个别值预测标准误,也称为容许(最大容忍的)标准误。个别值预测的标准误比均值预测的标准误多一个?(hat_sigma))

2

?predict newvar,stdp (均值预测标准误,也称为置信标准误) predict newvar,stdr (残差标准误)

predict newvar,welsch (Welsch氏距离影响统计量)

Terminology术语(略) 拟合值与残差

例1:拟合值和残差

回归分析之后,命令predict可以得到拟合值、残差和其他统计量。help predict得到详细清单。继续第6讲线性回归分析的例1,拟合模型:

mpg= ??0+??1weight+??2foreign+??

useauto,clear

regress mpg weight foreign predict pmpg (生成拟合值) predict resid, resid (生成残差) summarizepmpg mpgresid list make mpg pmpgresid in 1/10

twoway scatter residpmpg,yline(0) (残差对拟合值的散点图,后面有专门命令rvfplot)

regress mpg weight if foreign

predict pmpg1 if e(sample) (子样本拟合模型得到的拟合值) predict pmpg2 (用全部观测值得到的样本之外的拟合值)

例2:Out-of-sample predictions (forecasts) (这里是截面样本) use newautos, clear predict pmpg list, divider

3

补充知识:Prediction standard errors(P1876—1877)

stdp计算线性预测的标准误差,其平方项是var y =??2???,它是由估计系j数向量b的不确定性引起的预测误差

根据模型,yj的真实值由y??=X??b+????=y j+????给定,因此var ???? =

22var y j+var ???? =?????+??,这是stdf的平方项。可以看到,stdf是预测误差

和残差误差的总和。

y的估计方差(回归的均方误)??2,??2???+??2 1???? =??2分解成预测方差??2???和残差方差??2 1???? ,而后者就是stdr的平方项。

例3:standard error of the forecast use newautos, clear(重复例2的操作) predict pmpg(重复例2的操作) predict se_pmpg, stdf list, separator(1)

(因此,mpg大约95%的置信区间就是pmpg±2·se_pmpg)

例4:投影矩阵(帽矩阵)的对角元素

投影矩阵的对角元素,是解释变量空间距离的度量。用于检测单个观测值的影响。 use auto, clear

regress mpg weight foreign predictxdist, hat

summarize xdist, detail(大约5%的样本的xdist值超过0.08,0.08可认为是临界值) listmake mpg foreign weightif xdist>.08,divider

参看lvr2plot关于杠杆作用对残差平方的散点图(leverage-versus-squared-residual plot)

4

补充知识:Standardized and Studentized residuals(P1879)

例5:标准化和学生化残差(在识别异常值上,学生化残差要优于标准化残差。学生化残差可以解释为t统计量,用于检验虚拟变量的显著性。虚拟变量在特定观测值等于1,其余为0。) use auto, clear

regress price weight foreign##c.mpg predictesta if e(sample), rstandard predictestu if e(sample), rstudent

lvr2plot ,mlabel(make) (我们发现,VW Diesel(大众)具有最高的杠杆,但残差却很小。进一步观察VW Diesel的标准化和学生化残差) list make price estaestu if make==\

补充知识:DFITS, Cook’s Distance和Welsch Distance(P1880)

DFITS,Cook的D影响统计量和Welsch距离是三个工具,试图得到杠杆作用对残差平方的散点图信息的概要统计。也就是说,目的是创建一个由残差大小—异常值—hi大小—杠杆作用影响的指标。

例6:DFITS influence measure 接前面的例5,

predict e if e(sample), resid predictdfits, dfits

(模型有k = 5个自变量(包括常数项),n = 74个观测值;遵循2 k/n临界值) list make price e dfits if abs(dfits) > 2*sqrt(5/74), divider

predict cooksd if e(sample), cooksd(计算Cook’s distance) list make price e cooksd if cooksd> 4/74, divider(临界值4/n)

predict wd, welsch (计算Welsch distance)

5


第7讲 线性回归的后续估计命令.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:隧道工程期末试题B

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: