学号: 班级: 姓名:
实验四 回归分析的SAS过程(1)
实验目的:掌握利用SAS建立多元回归方程的方法,掌握PROC REG过程,
并能检验所建立回归方程的显著性与方程系数的显著性,能根据实际问题作预测与控制.
实验要求:编写程序,结果分析. 实验内容:
1.写出多元线性回归模型,给出经验回归方程,回归系数向量、误差方差的估计 公式;
(1).线性回归模型
Y??0??1X1??2X2????p?1Xp?1?? ?~N(0,?2)
n组数据(yi;x1,x2,?,xn,)(i?1,2,?,n)
矩阵形式 Y?Xβ?ε ε~N(0,?2I),观测向量Y
SSE?1T2T?1T??(??,??,?,??)??X ??, ,H?X(XTX)β(XX)XY01p?1n?p??β?X???β?X?Xβ??HY ??(y?1,y?2,?,y?n)T?β(2).经验回归方程Y011p?1p?1?i??1xi1??2xi2????p?1xi,p?1. 其中 y(3).回归系数向量:β?(?0,?1,?,?p?1)T?回归系数向量 (4). 误差方差的估计:ε?(?1,?2,?,?n)T?随机误差向量
??(I?H)Y ??Y?Y εSSEYT(I?H)Y??D?? ? ?n?pn?p2?2.写出平方和分解公式,线性回归方程、回归参数的显著性检验步骤(假设、统
计量及分布、检验p值),说明何时线性关系显著? 给出因变量预测值及置信区间?
平方和分解公式:SST?SSE?SSR
1. 离差平方和分解
样本数据y1,y2,?,yn线性拟合值
学号: 班级: 姓名:
1n?i??1xi1??2xi2????p?1xi,p?1,y??yi, yni?1总离差平方和SST??(yi?y)2
i?1n?i2 ?i)???残差平方和SSE??(yi?y2i?1i?1nn?i?y)2 回归平方和SSR??(yi?1n2.复相关系数
R2?SSRSSE?1? SSTSSTR?R2????复相关系数
????X?????X的相关系数的绝对值,??? R(0?R?1)为Y与Y011p?1p?1????X?????X的线性关系越显著. ???因此,R2越大,Y与Y011p?1p?1二.线性回归方程的显著性检验
假设H0:?1??2????p?1?0?H1:存在1?i?p?1,?i?0
如假设H0为真,则Y??0??,从而X1,X2,?,Xn的线性组合不能描述Y任何变化,变化来自误差项;如H1为真,Y至少和某些变量线性相关,从而误差项引起的Y的变化会相对减少.
构造统计量
SSR/(p?1)MSRH0真F??~F(p?1,n?p)
SST/(n?p)MSE给出显著性水平?,则拒绝域F?F?(p?1,n?p).
学号: 班级: 姓名:
p 1?? F?F0
检验p值,p?PH(F?F0),p??时,F0落入拒绝域,因此拒绝H0,
0认为线性回归显著;否则Y与X1,X2,?,Xp?1线性关系不显著. 预测及其统计推断
设(x01,x02,?,x0,p?1)为X1,X2,?,Xp?1的一组新观测值,Y取值为y0,预测即对y0值作估计,令x0?(1,x01,x02,?,x0,p?1)T,利用回归方程,y0的预测值
T?????x???x???x?0??y0101202p?10,p?1?x0β
而
y0的置信度为
1??置信区间为
?TT?1?y??t(n?p)MSE[1?x(XX)x0],0?0?1?2??0?ty?TT?1?(n?p)MSE[1?x(XX)x]?00? 1?2?2. 书上作业 2.3(单)
答:(1)约简模型:yi??0??1xi1??2xi2??i,i?1,2,...,n 检验统计量及其零分布:F?[SST(R)?SSE(F)]/2MSR?~F(2,n?5)
SSE/(n?5)MSE(2)约简模型:yi??0??1xi1??2xi2??3xi1xi2?xi3??i,i?1,2,...,n 检验统计量及其零分布:F?SST(R)?SSE(F)MSR?~F(1,n?5)
SSE/(n?5)MSE2.4解:(1)建立回归模型进行统计推断
学号: 班级: 姓名:
设Y与X1,X2回归模型Y??0??1X1??2X2??, 观测值满足F?(SST?SSE)/(p?1)?MSR~F(p?1,n?p),
SSE/(n?p)MSEi=1,2,…,15.
其中?i(i=1,2,…,15)相互独立,且?i~N(0,?2). 即 Y?Xβ?ε, ε~N(0,?2I)
1)SAS系统回归分析的proc reg 过程进行统计推断 程序:
(2)由方差分析表进行统计推断
学号: 班级: 姓名:
从方差分析表得出??2?MSE?4.47030;
线性回归关系显著性检验: H0:?1??2?0
MSRH0真统计量F?~F(2,12),其观测值F0?5679.387
MSEp?PH0(F?F0)?0.0001,拒绝H0,认为Y与X1,X2的线性回归关系是高
度显著的.
另外,由方差分析表给出R2?关系高度显著. (3)置信区间:
进一步,取置信水平??0.05,由于t?(n?p)?t0.975(12)?2.17881,利
1?2SSR53845??0.9989, 也表明线性回归SST53902用表中的参数估计值和相应的标准差估计式?k?t0.975(12)s(?k),求得
?0,?1,?2的置信度
???95%的置信区间分别为
??0:?0?t0.975(20)s(?0)?3.45261?2.17881?2.43065?(?1.84331,8.748535) ?1:0.49600?2.17881?0.00605?(0.48282,0.50918)
?2:0.00920?2.17881?0.00096811?(0.00709,0.01131)