第10章 回归分析(5)

2019-07-30 13:06

Canonical Analysis of Response Surface (based on coded data) Critical Value Factor Coded Uncoded X1 0.975447 9.877233 氮 X2 2.488929 10.466786 磷 Predicted value at stationary point 265.997016 Eigenvectors Eigenvalues X1 X2 -8.702428 0.032956 0.999457 -23.730608 0.999457 -0.032956 Stationary point is a maximum.

对原自变量X1、X2分别进行转换:

x1’=(x1-5)/5 X2’=(X2一3)/3

模型中的线性及二次回归项均显著(0=0.05),交叉项不显著。由原变量建立的回归方程为:

Y=74.147857+ 18.047714X1+19.627500X2-0.948571XI*X1 +0.066000x1*x2-0.968750x2*x2 X1*X2与X2*X2两项不显著。

输出结果还给出了用变换后的变量建立的模型参数估计值。 上面程序可改为:

DATA new;

do x1=0.0 to 10.0 by 2.5; do x2=0 to 6 by 2; INPUT y@@; output; end; end;

label x1=\氮\磷\产量\ CARDS;

84.5 105.5 156.0 154.0 100.0 131.5 177.0 188.0 142.0 165.5 211.0 117.0 175.5 193.0 245.0 255.0 161.0 172.0 233.5 235.5 PROC RSREG;

MODEL y=x1 x2; RUN;

10-21

§10.6 逐步回归分析过程STEPWISE

STEPWISE过程可在全体自变量中找出其作用最显著的部分自变量来建立回归方程,此过程提供五种逐步回归方法。

一、过程格式:

PROC STEPWISE 选项;。

MODEL因变量:自变量/选项; BY变量; FREQ变量; WEIGHT变量; ID 变量; VAR变量表;

OUTPUT OUT:输出数据集 关键字=新变量表;

PRINT选择项

二、过程说明

1.PROC STEPWISE 选项; 只有一个选项:

DATA=数据集指定输入数据集,缺省时为最新建立的数据集。 2.MODEL因变量=自变量/选项; 此语句指定要分析的因变量及自变量,可以有多个MODEL语句。常用在斜线(/) 之后的选项有:

NOINT模型中不含常数项。 FORWARD或下选用前进法。

前进法是从模型中没有变量开始,每次将一个最显著的变量引入模型,直到模型以外的变量不再有显著的下值为止。 BACKWAND或B选用后退法。

后退法是从模型中含有所有自变量开始,每次从模型中剔除一个贡献最小的变量,直到模型中只剩下均为显著的变量为止。 STEPWISE选用逐步法,此为缺省时的方法。

逐步法是每次引入模型一个最显著的变量,然后考虑从模型中剔除一个最不显著的变量,直到既没有变量引入也没有变量剔除为止。

2

MAXR最大R改进法,此方法要求模型中的变量个数不超过20。MAXR改进法是

2

从模型中没有变量开始,每次选择一个产生最大R的变量进入模型,然后将模型中

2

的每个变量与模型外的变量比较,决定是否用能产生最大R的变量代替模型中的某

2

一变量,直到没有替换可增加R为止。

10-22

MINR最小R改进法,此方法要求模型中的变量个数不超过20。此方法类似于

2

MAXR法,但MINR法寻找产生最小R增量的替换。 3.BY变量;

按BY指定的变量分组分别进行分析。

2

三、输出说明

(1)R-SQUARE 复相关系数平方R。

(2)C(P) Cp统计量,是误差总平方的度量。 (3)REGRESSION 回归变异。 (4)ERROR 误差变异。 (5)TOTAL 总的变异。

(6)SUM OF SOUARES 平方和。

(7)MEAN SQUANE 均方,其值为平方和除以自由度。 (8)F F值,其值为回归均方除以误差均方。 (9)PROB>F F值的显著水平。

(10)PARAMETER ESTIMATE 回归系数估计值。 (11)STANDARD ERROR 估计的标准误。

(12)TYPE I1 SUM OF SQUARES 每个变量的TYPE II平方和。

例10.6 某地区1963年至1980年18年的春粮播种面积为x1(万亩),化肥施用量为X2(500吨),肥猪头数X3(万头),水稻抽穗扬花期降水量为X4及春粮产量Y(500吨),试建立春粮产量的预报模型。 程序如下:

TITLE1 \逐步回归分析\;

data new;

input x1-x4 y@@;

label x1=\播种面积\施肥用量\

label x3=\养猪头数\降水量\春粮产量\ cards;

137 4 15 27 309 148 6 26 38 400 154 10 33 20 454 157 18 38 99 520 153 13 41 43 516 151 10 39 33 459 151 15 37 46 531 154 16 38 78 558 155 27 44 52 607 155 36 51 22 541 156 46 53 39 597 155 47 51 28 558 157 48 51 46 619 156 60 52 59 618 159 96 52 70 742 164 191 57 52 805 164 186 68 38 859 156 195 74 32 855 ;

proc stepwise; model y=x1-x4; run;

10-23

2

运行结果:

Stepwise Procedure for Dependent Variable Y

Step 1 Variable X3 Entered R-square = 0.85890646 C(p) = 43.16549537 DF Sum of Squares Mean Square F Prob>F Regression 1 328629.63607533 328629.63607533 97.40 0.0001 Error 16 53984.36392467 3374.02274529 Total 17 382614.00000000

Parameter Standard Type II

Variable Estimate Error Sum of Squares F Prob>F INTERCEP 138.02412869 47.41140043 28595.15580345 8.48 0.0102 X3 9.83361669 0.99640045 328629.63607533 97.40 0.0001

Bounds on condition number: 1, 1

----------------------------------------------------------------------------------- Step 2 Variable X2 Entered R-square = 0.92950851 C(p) = 16.56035153 DF Sum of Squares Mean Square F Prob>F Regression 2 355642.96789963 177821.48394981 98.90 0.0001 Error 15 26971.03210037 1798.06880669 Total 17 382614.00000000

Parameter Standard Type II

Variable Estimate Error Sum of Squares F Prob>F INTERCEP 264.80789133 47.62183599 55597.57931226 30.92 0.0001 X2 1.07390189 0.27706310 27013.33182430 15.02 0.0015 X3 5.70949076 1.28887726 35284.00963138 19.62 0.0005 Bounds on condition number: 3.139764, 12.55906

---------------------------------------------------------------------------------- Step 3 Variable X4 Entered R-square = 0.96392407 C(p) = 4.61653451 DF Sum of Squares Mean Square F Prob>F

Regression 3 368810.84281379 122936.94760460 124.69 0.0001 Error 14 13803.15718621 985.93979901 Total 17 382614.00000000

Parameter Standard Type II

Variable Estimate Error Sum of Squares F Prob>F INTERCEP 205.05939930 38.86931817 27440.74604456 27.83 0.0001 X2 1.09987019 0.20528681 28301.61086710 28.71 0.0001 X3 5.62602957 0.95468018 34240.38241305 34.73 0.0001 X4 1.35926946 0.37194002 13167.87491417 13.36 0.0026

10-24

Bounds on condition number: 3.14353, 21.85908

----------------------------------------------------------------------------------

All variables left in the model are significant at the 0.1500 level. No other variable met the 0.1500 significance level for entry into the model. Summary of Stepwise Procedure for Dependent Variable Y Variable Number Partial Model

Step Entered Removed In R**2 R**2 C(p) F Prob>F Label

1 X3 1 0.8589 0.8589 43.1655 97.3999 0.0001 养猪头数

2 X2 2 0.0706 0.9295 16.5604 15.0235 0.0015 施肥用量

3 X4 3 0.0344 0.9639 4.6165 13.3557 0.0026 降水量

第一步引入变量X3,第二步引入变量X2,第三步又引人变量x4,以后既没有变量剔除也没有变量引入,故最终模型中仅包含变量X3、X2和X4。输出结果给出了由这三个变量建立的线性模型的参数估计值及显著性检验等)。

由原变量建立的回归方程为:

Y=205.05939930+ 1.09987019X2+5.62602957X3+1.35926946X4

10-25


第10章 回归分析(5).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:城市管理执法大队养犬管理专项整治工作总结

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: