SAS备课笔记 - 简单线性回归、多元线性回归 - 图文(6)

2020-02-21 16:12

2009_SAS备课笔记_回归分析

【案例7】水泥数据:水泥在凝固时单位质量所释放的热量为Y卡/克与水泥中下列四种化学成分有关:

x1?3CaO?Al2O3的成分%,x2?3CaO?SiO2的成分%, x3?4CaO?Al2O3?Fe2O3的成分%,x4?2CaO?SiO2的成分%,

共观测了13:组数据,试求出y与x1,x2,x3,x4的关系式。

【逐步回归】

在实际问题中,影响因变量Y的因素(自变量)可能很多,人们希望从中挑选出影响显著的自变量来建立回归关系式,这就涉及到变量选择问题。

在回归方程中若漏掉对Y影响显著的变量,那么建立的回归式用于预测时会产生大的偏差。但回归式中若包含的变量太多,且其中有些对Y影响不大,显然这样的回归式不仅使用不方便,而且反而会影响预测的精度。因而适当选择变量用于建立一个“最优”的回归方程是十分重要的问题。

什么是“最优”回归方程?直观考虑应该是方程中包含的所有变量对因变量Y的影响都是显著的,而不包含在方程中的变量对Y的影响是不显著的(可忽略)。.也就是从自变量集中选出适当的子集,使得建立y与其的回归方程就是这样的“最优”,这就是回归变量的选择问题。

回归变量的选择问题在实用上和理论上都是十分重要的,这个问题最大的困难就是如何比较不同选择(即不同子集)的优劣,即最优选择的标准。从不同的角度出发,可以有不同的比较准则,在不同的准则下“最优”回归方程也可能不同。

最优选择的标准:(1)均方误差最小 (2)预测均方误差最小 (3)Cp统计量最小准则

(4)AIC或BIC准则 (5)修正R2准则(最大)

选择“最优”子集回归的方法:(1)选择“最优”子集的简便方法包括:逐步筛选法(STEPWISE)、向前引入法(FORWARD)和向后剔除法(BACKWARD) (2)计算量最大的全子集法:通过计算所有可能回归子集后按最优选择的标准选择最优回归方程。包括R2选择法(RSQUARE)、Cp选择法(CP)和修正R选择法(ADJRSQ)。 (3)计算量适中的选择法:没有计算所有可能回归子集,但比较的子集个数多于(1)中提到的逐步筛选等一些选择法,如最小R增量法(MINR)和最大R增量法(MAXR)。 逐步回归的基本思想:逐个引入自变量,每次引入对Y影响最显著的自变量,并对方程中的老变量逐个进行检验,把变为不显著的变量逐个从方程中剔除掉。最终得到的方程中既不漏掉对Y影响显著的变量,又不包含对Y影响不显著的变量。

【程序】

编号:prog7_16

proc reg data=sasuser.heat;

model y= x1-x4 /seletion=stepwise

sle=0.1 sls=0.1;

print cli; run;

222

2009_SAS备课笔记_回归分析

基本回归诊断

基本回归诊断和拟合回归模型总是搅合在一起。首先拟合模型,然后用回归诊断检验这个模型。诊断结果可能导致你接着拟合第二个模型,再用回归诊断方法检验它。这个过程一直进行,直到求出拟合这组数据的最佳模型为止。

一、残差分析:1. 残差图 2. 方差齐性的诊断及修正方法 3.异常点的识别 二、贡献分析:1. 影响函数 2. Cook距离 3. WK统计量

三、共线性诊断:共线性问题是指拟合多元线性回归时,自变量之间存在线性关系或近似线性关系。自变量之间的线性关系将会隐蔽变量的显著性,增加参数估计的方差,还会产生一个很不稳定的模型。共线性诊断的方法是基于对自变量的观测数据构成的矩阵X'X进行分析,使用各种反映自变量间相关性的指标。共线性诊断常用统计量有方差膨胀因子VIF((或容限TOL)条件指数和方差比例等。

【程序】

编号:prog7_16_1

proc reg data=sasuser.heat; model y= x1-x4 /vif collinoint; run;

2009_SAS备课笔记_回归分析

处理多元线性回归中自变量共线性的几种方法 一、筛选变量的方法

二、岭回归方法

【经济分析数据的岭回归分析】考察进口总额Y与三个自变量:国内总产值工x1、存储量x2、总消费量x3。现收集了11年的数据。(数据编号:import)

【程序】

proc reg data=sasuser.import corr; model y=x1-x3 /vif collin; run;

【程序-岭回归】

proc reg data=sasuser.import outset=Oimport graphics outvif; model y=x1-x3 /ridge=0.0 to 0.1 by 0.01 0.2 0.3 0.4 0.5; plot / ridgeplot; proc print data=Oimport; run;

三、主分量回归法

【程序】

proc reg data=sasuser.import outset=Oimport; model y=x1-x3 /pcomit=1,2 outvif; run;

proc print data=Oimport; run;

2009_SAS备课笔记_回归分析

四、偏最小二乘回归法

【程序】

proc pls data=sasuser.import outset=Oimport cv=one method=simple; model y=x1-x3; run;

proc print data=Oimport; run;

2009_SAS备课笔记_回归分析

【编程】 SAS/STAT 中有许多具有回归分析功能的过程,功能最为全面的是过程REG。

基本格式:

proc reg data=数据集;

model 因变量名=自变量名; run;

例题-data7_04 一元线性回归

程序(prog7_04):

proc reg data=sasuser.data7_04; model y=x; run;

运行结果:


SAS备课笔记 - 简单线性回归、多元线性回归 - 图文(6).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:MB670掘锚机试题

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: