datalines; 1 1 0 0 4350 1 1 0 0 4650 1 1 0 0 4080 1 1 0 0 4275 2 0 1 0 4125 2 0 1 0 3720 2 0 1 0 3810 2 0 1 0 3960 2 0 1 0 3930 3 0 0 1 4695 3 0 0 1 4245 3 0 0 1 4620 run; proc glm; class type; model y=type;
means type/snk;/*多重比较*/ run;
/*SAS中的方差分析过程(一般线性模型,可进行方差分析和协方差分析)*/ proc reg; model y=x1-x3;
restrict 4*x1+5*x2+3*x3=0;/*约束条件*/ test x1=x2=x3;/*假设检验1*/ test x1=x2; test x1=x3; test x2=x3; run;
/*经过设置哑变量的方法进行回归建模,注意方差分析中的约束条件,以及所要进行的均值间差别的比较*/
上述生成哑变量的方法,可调用SAS中GLMMOD过程来完成,改造上述过程如下: data a;
input type x1 x2 x3 y; datalines; 1 1 0 0 4350 1 1 0 0 4650 1 1 0 0 4080 1 1 0 0 4275 2 0 1 0 4125 2 0 1 0 3720 2 0 1 0 3810 2 0 1 0 3960 2 0 1 0 3930
3 0 0 1 4695 3 0 0 1 4245 3 0 0 1 4620 run; data b;
set a(keep=type y); run;
proc glm data=b; class type; model y=type; means type/snk; run;
proc glmmod data=b outdesign=breg outpram=pram; class type; model y=type;
run;/*完全按照GLM过程的调用格式,生成的哑变量放在了数据集breg中了,这时要注意对应关系*/
proc reg data=breg; model y=col2-col4;
restrict 4*col2+5*col3+3*col4=0; m1_all:test col2=col3=col4; m2_3:test col3=col4; m1_2:test col3=col2; m1_3:test col2=col4; run;
/*有交互效应时的设计矩阵*/ data p224; input A$ B$ y; datalines; 1 1 130 1 1 155 1 1 174 1 1 180 1 2 34 1 2 40 1 2 80 1 2 75 1 3 20 1 3 70 1 3 82 1 3 58 2 1 150
2 1 188 2 1 159 2 1 126 2 2 136 2 2 122 2 2 106 2 2 115 2 3 25 2 3 70 2 3 58 2 3 45 3 1 138 3 1 110 3 1 168 3 1 160 3 2 174 3 2 120 3 2 150 3 2 139 3 3 96 3 3 104 3 3 82 3 3 60 run; proc glm; class A B; model y=A|B; means A B/snk; run;
proc glmmod data=p224 outdesign=outp224; class A B; model y=A|B; run;
第三章: 协方差分析
1. 原理
可归为分块线性模型的特殊情形。先将普通的线性模型分块,考虑分块模型时,两个参数估
计之间的关系,然后将这一关系应用于协方差分析模型上.
y?X??Z??e,E(e)?0,cov(e)??2In
X是n?p阵,Z是n?q阵,记W?(X?Z),??(??,??)?,则?的最小二乘解
??*??为:???*??(W?W)W?y,
???*略去Z?部分,得到y?X??,eE(?)e0,co?ve?(2)n,则I参数的最小二乘解
??(X?为:?X)?X?y(可称此为子模型的最小二乘解)
?的关系,假定Z的列满秩(rk(Z)?q),并且假定Z和X的列线性无关.则有: 下面看?*与??*?(Z?NXZ)?1Z?NXy
??X?* ?*??Z对任一可估函数c??,Var(c??)??c?Mc,其中XZ?(X?X)?X? X)?X?Z,NX?I?X(X?*2?(X?X)??X(Z?NZ)?1X??X(Z?NZ)?1?ZXZzX? M????(Z?NXZ)?1Xz?(Z?NXZ)?1???在进行协方差分析时,将Z?看成是协变量,只要针对?*作两两比较即可。
对任一可估函数c??,其BLU估计
??X?*)?[c?(X?c??*=?*?c?(?X)?X?c?XZ(Z?NXZ)?1Z?NX]Y Z若Y服从正态分布,则可进行假设检验或进行区间估计等。
假设检验H0:H?检验统计量:F??0
?(SSEH0?SSE)/rk(H)SSE/(n?rk(X?Z)),其中: SSEH0是指假设H0:H??0成立时的模型的残差平方和
SSE?y?(I?W(W?W)?W?)y,即含协变量时的模型残差平方和。 检验H0:??0
检验统计量:F??(SSEH0?SSE)/rk(Z)SSE/(n?rk(X?Z)) 其中:SSEH是指假设H0:?0?0成立时的模型残差平方和,即无协变量时的情况。
SSE?y?(I?W(W?W)?W?)y,即含协变量时的模型残差平方和。
例:比较三种饲料A1,A2,A3对猪增重的效果,考虑到初重量的影响,我们同时观测了每头猪的增加重量y和初重量x,数据如下表,问三种饲料对猪增重的效果有无差异?初始重量与猪的增重量有无明显的关系?