2011线性模型sas

2019-08-03 13:31

SAS for linear models

（按照书中章节排列）

第一章: 线性回归分析

对于线性模型的SAS程序的编制，主要牵涉到线性模型的一些理论问题：下面给出线性模型的理论框架，然后说明SAS中不同程序针对线性模型中的问题进行的操作。

注：对于二次型的一些结论：

对于正态随机向量独立性，就可通过计算相应的协方差阵来判断。

1. 线性模型的一般理论

yn?1?xn?(p?1)β(p?1)?1?en?1，e?N(0,?2In)H??d ??(x?x)?1x?y?N(β,?2(x?x)?1) 则有：β?的期望和方差的估计具有相同的形式。注1：将正态性去掉，则参数β注2:约束最小二乘估计：若参数间有约束H??d，则此时的最小二乘估计为：

?????(x?x)?1H?(H(x?x)?1H?)?1(H???d) ?H

??L(x?x)?1x?y?N(Lβ,?2L(x?x)?1L?) （重要）对于任一线性变换有：Lβ从而有：

121???Lβ)?(L(x?x)-1L?)?1(Lβ??Lβ)??2(rk(L)) (Lβ2?验统计量，以及置信区间。

y?(I-Px)y??2(n?p?1)（rk(x)?p?1，且二者相互独立，从而可构造假设检

1.1置信区间：置信随球：

?-Lβ)?(L(x?x)-1L?)-1(Lβ?-Lβ)/rk(L)(Lβ由P(?Frk(L),n?rk(x)(?))?1??

?y(I-Px)y/n?rk(x)?)?(L(x?x)-1L?)-1(Lβ-Lβ?)?F?2，则有置信椭球为：其中： (Lβ-Lβrk(L),n?rk(x)(?)?rk(L)???2 y?(I-Px)y/n?rk(x)??特别地，当rk(L)?1时，即参数的一个线性组合，

?)?(l?(x?x)-1l)-1(l?β-l?β?)?F?2(l?β-l?β1,n?rk(x)(?)??，即：

2?)2?(l?(x?x)-1l)?F?，置信区间为： (l?β-l?β(?)??1,n?rk(x)???-t??-1????-1??(l?βn?rk(x)(2)???l(xx)l,lβ?tn?rk(x)(2)???l(xx)l)

同时置信区间：

1）Scheffè区间(针对所有的线性组合而言，这里牵涉到一个定理，可作补充材

料)

1/2??(rk(L)?F??l?(x?x)-1l l?β??rk(L),n?rk(x)(?))2)Bonferroni区间（m个线性组合同时成立）

???-t??-1????-1??(l?βn?rk(x)(2m)???l(xx)l,lβ?tn?rk(x)(2m)???l(xx)l)

???-t??t??,l?β??) 此即：(l?βn?rk(x)(2m)??l?βn?rk(x)(2m)??l?β这两者间的差别在于这两个量的大小，t2n?rk(x)(2?和rk(L)?Frk(L),n?rk(x)(?)，哪一m)个大，哪一个的置信区间就会大。

注1：Scheffè区间并不是一个或若干个可估函数的同时区间估计，而是无穷多个可估函数的同时区间估计，当然实际应用中往往只对有限个可估函数感兴趣，采用Scheffè区间常常会嫌其偏长，但该方法的优点是，它适用于所有的线性模型，对设计阵无任何限制，应用范围较广。

注2：一般而言：Scheffè区间比Bonferroni区间要好，但当比较的可估函数较少时，Bonferroni区间要好些。

1.2 平方和的分解：

y?y=11y?11?y+y?(Px-n11?)y+y?(I-Px)y 其中：Px=x(x?x)-1x?为投影矩阵 n1（理论方面要用到正态分布的二次型服从ss回归?y?(Px-n11?)y,ss残差?y?(I-Px)y，

卡方分布的充要条件：对称幂等矩阵，自由度为该矩阵的秩。

R2?SSSS回?1?残差 SSTSSTSS/n?p?1MSE?1?残差 MSTSST/n?1修正的R2，R2?1?1.3 预测值的置信区间：

????x?...???x?x?β? ?x?? 对于给定的观测值x，其预测值为：y011pp?x)?x?(X?X)?1x?2 V(y?x)?(1?x?(X?X)?1x)?2,其中的?2用??2?MSE去估计 V(y?y??t?clm:均值的置信区间(y2?x),y??t?2(n?1)?V(y?x)) (n?1)?V(y?(y?y?(y?y??t?2(n?1)?V?),y??t?2(n?1)?V?)) CLI: 预测值的置信区间：(y1.4 假设检验（需要正态性的假定）

?)?(L(x?x)-1L?)?1(Lβ?)/rk(L)(LβH0:Lβ=0，统计量为：F??F(rk(L),n?p?1)

y?(I-Px)y/(n?(p?1))注：1）检验H0:β=0，即回归系数是否为0，只要令L=I

?β(1)?2）令β=??，检验H0:β(2)=0（此即两个模型的比较），特例检验某个

β?(2)?系数是否为0。如：F?R(?q?1,...,?p|?0,?1,...,?q)/p?qMSE；

F?R(?p|?0,?1,...,?p?1)/1MSE

2. 回归分析举例

2.1 一元回归 (选项p,cli,clm,作图)

/* Use the following DATA step to produce Output 2.1 through 2.4. */; 注：cattle：the numbers of head of cattle(in thousands)

cost: the cost(in thousands of dollars) marketid: livestock auction markets'name

goal:1)cost 与 cattle间的线性关系 2）平均费用/每cattle---回归系数

3) 确定cost中变化，多少是由cattle决定的（ R2值）

data market;

input marketid $ cattle cost; datalines;

A 3.437 27.698 B 12.801 57.634 C 6.136 47.172 D 11.685 49.295 E 5.733 24.115 F 3.021 33.612 G 1.689 9.512 H 2.339 14.755 I 1.025 10.570 J 2.936 15.394 K 5.049 27.843 L 1.693 17.717 M 1.187 20.253 N 9.730 37.465 O 14.325 101.334 P 7.737 47.427 Q 7.538 35.944 R 10.211 45.945 S 8.697 46.890 ;

proc print data=market; run;

proc reg data=market; id cattle;

共9页:

2011线性模型sas.doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档