经典线性回归模型(设定与推断)(3)

2019-06-11 00:09

实际上,我们还能证明:在假定2.1~假定2.5下,系数向量的OLS估计量也是ML估计量,而?2的ML估计量则为

? ? 2 ? 1 RSS

n最大对数似然函数值是 ?log(2?)??log(n2n2n2RSS) n·回归函数的估计和因变量的预测

如果线性拟合模型经过检验是显著的,那么我们就可用它来做估计回归函数和预测因变量。对给定自变量的一组新的观测值x0??1,x01,?,x0p?T,估计对应的回归

TT函数值x0?和预测对应的因变量值y0。显然回归函数x0?的估计值和y0的预测值均

?0?xTb?b0?b1x01???bpx0p y0估计值的抽样误差和预测值的预测误差分别为 xT??xTb??xT?b???

000TT?0?xT?b??? y?y????xb???x000在假定2.1~假定2.5下,抽样误差和预测误差的分布分别为

TT??x0b~N0,?2xT?XTX?x x0?1?0~N0,?21?xT?XTX? y?y0???0?1?x??

00可进一步证明

TTx0??x0bTsxTXX0???1~t?n?p?1? x0~t?n?p?1? x0?0y?yTs1?xTXX0???1T由此得到回归函数x0?的区间估计和因变量y0的区间预测分别为

?0?ty??n?p?1?s1?2xTXTX0???1x0

?0?ty??n?p?1?s1?21?xTXTX0???1x0

T特别在只有一个自变量的情况下,回归函数x0?的区间估计和因变量y0的区间预测

分别为

?0?ty??n?2?s1?21?n?xni?10?xi?2??xn?x?

21?0?t??n?2?s1??y1?n2?xi?10?xi?2??x?x?

2

§2.7 R中有关线性回的函数

下面通过一个例子来说明R中与线性回归相关的函数。

例 根据经验,在人的身高相等的情况下,血压的收缩压Y与体重x1(kg)和年龄x2(岁数)有关。现收集13个男子的数据,试建立Y关于x1和x2的线性回归方程。 > blood<-data.frame(

lm.sol<-lm(Y ~ X1+X2, data=blood) X1=c(76.0, 91.5, 85.5, 82.5, 79.0, 80.5, 74.5, 79.0, 85.0, 76.5, 82.0, 95.0, 92.5), X2=c(50, 20, 20, 30, 30, 50, 60, 50, 40, 55, 40, 40, 20), Y= c(120, 141, 124, 126, 117, 125, 123, 125, 132, 123, 132, 155, 147) ) > cor(blood) X1 X2 Y X1 1.0000000 -0.7002831 0.9064018 X2 -0.7002831 1.0000000 -0.3827729 Y 0.9064018 -0.3827729 1.0000000 plot(blood) lm( )函数用于估计线性模型,此函数返回一个线性拟合模型(lm对象)。此函数的一般用法为

lm(formula,data, subset,...)

formula 指定R的模型公式,其形式是y~x1+x2+...+xp。如果线性模型中不包含常数

项,那么要在模型公式中增加自变量0,y~0+x1+x2+...+xp。R允许在模型 公式中使用表达式作为变量,log(y) ~ x1 + log( x2)。为了避免表达式 中的算术运算符与公式中的+,-,*,^等运算符号相混淆,可使用I( ) 函数将整个表达式包围起来作为一个变量,log(y) ~ x1 + I(x2+x3)。

data 可选的数据框,指定样本数据。

subset 可选的向量,指定样本数据的子集,并用这个子集来估计模型。

lm对象是一个保存线性拟合模型信息的列表,此列表中的常用信息有 coefficients 系数向量的OLS估计值。 residuals OLS残差向量 fitted.values OLS拟合值向量 df.residual 残差的自由度n-p-1 > lm.sol$coefficients (Intercept) X1 X2 -62.9633591 2.1365581 0.4002162 > lm.sol$residuals 1 2 3 4 5 6 7 0.5741329 0.4639664 -3.7166848 0.6908281 -0.8312185 -4.0403788 2.7768085 8 9 10 11 12 13 -0.8355416 -2.6527288 0.5047730 3.7569456 -1.0183102 4.3274082 > lm.sol$fitted.values 1 2 3 4 5 6 7 8 119.4259 140.5360 127.7167 125.3092 117.8312 129.0404 120.2232 125.8355 9 10 11 12 13 134.6527 122.4952 128.2431 156.0183 142.6726 > lm.sol$df.residual [1] 10> 另外,还可通过一些函数获取更多线性拟合模型的信息。这些函数有 summary( ) 计算线性拟合模型的基本统计量,返回的是一个列表。 anova( ) 计算单个或多个线性拟合模型的方差分析表。 coef( ) 提取系数向量的估计值。 resid( ) 提取残差向量。 fitted( ) 提取拟合值向量。

vcov( ) 提取β的OLS估计量条件方差阵的估计。 deviance( ) 计算残差平方和。 formula( ) 提取模型公式。 summary( ) 函数的主要用法为

summary(object, correlation = FALSE) 其返回的列表中的常用统计量有

residuals 线性拟合模型的残差向量。

coefficients 关于系数向量估计的(p+1)×4矩阵。

sigma 误差标准差的估计值(回归标准误,残差标准误)。 r.squared 决定系数。 adj.r.squared 修正决定系数。

fstatistic 回归方程显著性检验的F统计量、分子自由度和分母自由度。

?1cov.unscaled 未乘s2的β的OLS估计量的条件方差阵的估计,即?XTX?。

correlation 如果correlation =TRUE,β的OLS估计量的条件相关系数阵的估计。 > (out=summary(lm.sol) ) Call: lm(formula = Y ~ X1 + X2, data = blood) Residuals: Min 1Q Median 3Q Max -4.0404 -1.0183 0.4640 0.6908 4.3274 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -62.96336 16.99976 -3.704 0.004083 ** X1 2.13656 0.17534 12.185 2.53e-07 *** X2 0.40022 0.08321 4.810 0.000713 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’1 Residual standard error: 2.854 on 10 degrees of freedom Multiple R-squared: 0.946, Adjusted R-squared: 0.935 F-statistic: 87.84 on 2 and 10 DF, p-value: 4.531e-07 > out$sigma [1] 2.853596 > out$r.squared [1] 0.9461441 > out$adj.r.squared [1] 0.935373 > out$fstatistic value numdf dendf 87.84038 2.00000 10.00000


经典线性回归模型(设定与推断)(3).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:2015广西百色市事业单位招聘考试信息查看

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: