2011线性模型sas

2019-08-03 13:31

SAS for linear models

(按照书中章节排列)

第一章: 线性回归分析

对于线性模型的SAS程序的编制,主要牵涉到线性模型的一些理论问题:下面给出线性模型的理论框架,然后说明SAS中不同程序针对线性模型中的问题进行的操作。

注:对于二次型的一些结论:

对于正态随机向量独立性,就可通过计算相应的协方差阵来判断。

1. 线性模型的一般理论

yn?1?xn?(p?1)β(p?1)?1?en?1,e?N(0,?2In)H??d ??(x?x)?1x?y?N(β,?2(x?x)?1) 则有:β?的期望和方差的估计具有相同的形式。 注1:将正态性去掉,则参数β注2:约束最小二乘估计:若参数间有约束H??d,则此时的最小二乘估计为:

?????(x?x)?1H?(H(x?x)?1H?)?1(H???d) ?H

??L(x?x)?1x?y?N(Lβ,?2L(x?x)?1L?) (重要) 对于任一线性变换有:Lβ从而有:

121???Lβ)?(L(x?x)-1L?)?1(Lβ??Lβ)??2(rk(L)) (Lβ2?验统计量,以及置信区间。

y?(I-Px)y??2(n?p?1)(rk(x)?p?1,且二者相互独立,从而可构造假设检

1.1置信区间: 置信随球:

?-Lβ)?(L(x?x)-1L?)-1(Lβ?-Lβ)/rk(L)(Lβ由P(?Frk(L),n?rk(x)(?))?1??

?y(I-Px)y/n?rk(x)?)?(L(x?x)-1L?)-1(Lβ-Lβ?)?F?2,则有置信椭球为:其中: (Lβ-Lβrk(L),n?rk(x)(?)?rk(L)???2 y?(I-Px)y/n?rk(x)??特别地,当rk(L)?1时,即参数的一个线性组合,

?)?(l?(x?x)-1l)-1(l?β-l?β?)?F?2(l?β-l?β1,n?rk(x)(?)??,即:

2?)2?(l?(x?x)-1l)?F?,置信区间为: (l?β-l?β(?)??1,n?rk(x)???-t??-1????-1??(l?βn?rk(x)(2)???l(xx)l,lβ?tn?rk(x)(2)???l(xx)l)

同时置信区间:

1)Scheffè区间(针对所有的线性组合而言,这里牵涉到一个定理,可作补充材

料)

1/2??(rk(L)?F??l?(x?x)-1l l?β??rk(L),n?rk(x)(?))2)Bonferroni区间(m个线性组合同时成立)

???-t??-1????-1??(l?βn?rk(x)(2m)???l(xx)l,lβ?tn?rk(x)(2m)???l(xx)l)

???-t??t??,l?β??) 此即:(l?βn?rk(x)(2m)??l?βn?rk(x)(2m)??l?β这两者间的差别在于这两个量的大小,t2n?rk(x)(2?和rk(L)?Frk(L),n?rk(x)(?),哪一m)个大,哪一个的置信区间就会大。

注1:Scheffè区间并不是一个或若干个可估函数的同时区间估计,而是无穷多个可估函数的同时区间估计,当然实际应用中往往只对有限个可估函数感兴趣,采用Scheffè区间常常会嫌其偏长,但该方法的优点是,它适用于所有的线性模型,对设计阵无任何限制,应用范围较广。

注2:一般而言:Scheffè区间比Bonferroni区间要好,但当比较的可估函数较少时,Bonferroni区间要好些。

1.2 平方和的分解:

y?y=11y?11?y+y?(Px-n11?)y+y?(I-Px)y 其中:Px=x(x?x)-1x?为投影矩阵 n1(理论方面要用到正态分布的二次型服从ss回归?y?(Px-n11?)y,ss残差?y?(I-Px)y,

卡方分布的充要条件:对称幂等矩阵,自由度为该矩阵的秩。

R2?SSSS回?1?残差 SSTSSTSS/n?p?1MSE?1?残差 MSTSST/n?1修正的R2,R2?1?1.3 预测值的置信区间:

????x?...???x?x?β? ?x?? 对于给定的观测值x,其预测值为:y011pp?x)?x?(X?X)?1x?2 V(y?x)?(1?x?(X?X)?1x)?2,其中的?2用??2?MSE去估计 V(y?y??t?clm:均值的置信区间(y2?x),y??t?2(n?1)?V(y?x)) (n?1)?V(y?(y?y?(y?y??t?2(n?1)?V?),y??t?2(n?1)?V?)) CLI: 预测值的置信区间:(y1.4 假设检验(需要正态性的假定)

?)?(L(x?x)-1L?)?1(Lβ?)/rk(L)(LβH0:Lβ=0,统计量为:F??F(rk(L),n?p?1)

y?(I-Px)y/(n?(p?1))注:1)检验H0:β=0,即回归系数是否为0,只要令L=I

?β(1)?2)令β=??,检验H0:β(2)=0(此即两个模型的比较),特例检验某个

β?(2)?系数是否为0。如:F?R(?q?1,...,?p|?0,?1,...,?q)/p?qMSE;

F?R(?p|?0,?1,...,?p?1)/1MSE

2. 回归分析举例

2.1 一元回归 (选项p,cli,clm,作图)

/* Use the following DATA step to produce Output 2.1 through 2.4. */; 注:cattle:the numbers of head of cattle(in thousands)

cost: the cost(in thousands of dollars) marketid: livestock auction markets'name

goal:1)cost 与 cattle间的线性关系 2)平均费用/每cattle---回归系数

3) 确定cost中变化,多少是由cattle决定的( R2值)

data market;

input marketid $ cattle cost; datalines;

A 3.437 27.698 B 12.801 57.634 C 6.136 47.172 D 11.685 49.295 E 5.733 24.115 F 3.021 33.612 G 1.689 9.512 H 2.339 14.755 I 1.025 10.570 J 2.936 15.394 K 5.049 27.843 L 1.693 17.717 M 1.187 20.253 N 9.730 37.465 O 14.325 101.334 P 7.737 47.427 Q 7.538 35.944 R 10.211 45.945 S 8.697 46.890 ;

proc print data=market; run;

proc reg data=market; id cattle;


2011线性模型sas.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:2013年到2016年历年高考语文病句题汇编附答案带解析

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: