第10章 回归分析(3)

2019-07-30 13:06

B4=5,7,10 TO 13;

上述设置指定了1×3×4×4×6=288种初始值组合,分别计算残差平方和,最后选出一组数作为参数初始值,这显然要花费较长的计算时间。但是较好的参数初始值可以显著减少迭代的运算时间。 ? MODEL语句

该语句定义非线性模型的依变量及表达式,表达式中含有参数。例如: MODEL y=b0*(1-EXP(-b1*x)); 或:MODEL.y=b0*(1-EXP(-b1*x)); 后者亦可用复合变量名MODEL.y代表预测值。 ? BOUNDS语句

该语句为参数估计设置限制条件。例如:BOUNDS b1<=20;或BOUNDS 3<=b2<=10;。

● DER语句

该语句指定参数的一阶或二阶偏导数表达式。用METHOD指定的迭代方法不同时,则DER语句的方式也不同:

①当METHOD=DUD时,不需给出偏导表达式,即省略DER语句。

②当METHOD=GAUSS,MARQUART或GRADIENT时,需要给出一阶偏导数表达式。指定一阶偏导数的DER语句格式为:DER.参数=偏导数表达式;

③当METHOD=NEWTON时,需要给出一阶和二阶偏导数表达式。指定二阶偏导数的DER语句格式为:DER.参数.参数=偏导表达式;。 ? OUTPUT语句

该语句指定建立一个输出数据集,其中含有原始观察值数据(包括自变量和依变量)和各种统计量,这些统计量的类型由等号左边的关键词指定,名称由等号右边的变量名给出。常用的关键词有:

PREDICTED或P 依变量的观察值。

L95 预测值的置信度为95%的置信区间的下限。 U95 预测值的置信度为95%的置信区间的上限。 RESIDUAL 残差值(即实际值减去预测值)。

PARMS 各参数估计值。要为每个参数的估计值分别指定名称,例如假定有三个参数,可以写为:PARMS=B0 B1 B2。

SSE或ESS 残差平方和。 STDI 观察值的标准误。 ? ID语句

该语句为OUTPUT指定的输出数据集设定标示变量。 ? BY语句

该语句要求对于BY语句指定变量的每一个水平分别单独进行分析。 ? 其他语句

在NLIN过程中,可以使用DATA步中的许多SAS语句,NLIN过程允许用户在过

10-11

程中通过赋值语句产生新的临时变量,并能在MODEL等语句中使用。

10.4.3 输出说明

输出结果主要包括:

(1) 各参数初始值组合的残差平方和。残差平方和越小,说明参数的初始值越接近它们的估计值。

(2) 迭代过程中的每一次迭代的参数估计值和残差平方和。 (3) 方差分析表。

(4) 参数估计值。包括: Parameter 参数名称;

Estimate 参数最终估计值;

Asymptotic Std. Error 参数的渐进标准误;

Asymptotic 95 % Confidence Interval Lower and Upper 参数的渐进95%置信区间的上、下限。

(5) Asymptotic Correlation Matrix 参数的渐进相关矩阵。

10.4.4 应用实例

例10.4 酵母种群的增长资料如表10.3,试拟合生长模型。

表10.3 酵母种群增长资料

时刻X 0 1 2 3 4 5 6 7 8 9 酵母数Y 9.6 18.3 29.0 47.2 71.1 119.1 174.6 257.3 350.7 441.0 时刻X 10 11 12 13 14 15 16 17 18 酵母数Y 513.3 559.7 594.8 629.4 640.8 651.1 655.9 659.6 661.8 程序1 MARQUARDT法求解LOGISTIC模型的参数。 ? 程序及说明

/* 数据来源:田志宏,农业系统科学与综合研究,1990,(2):60*/ /* MARQUARDT法 LOGISTIC模型 */ DATA NEW;

INPUT x y; Cards;

0 9.6 1 18.3 2 29.0 3 47.2 4 71.1 5 119.1 6 174.6

10-12

7 257.3 8 350.7 9 441.0 10 513.3 11 559.7 12 594.8 13 629.4 14 640.8 15 651.1 16 655.9 17 659.6 18 661.8

PROC NLIN OUTEST=RESULT1 METHOD=MARQUARDT BEST=2; PARMS K=660 TO 665 BY 1 A=3 TO 5

B=-0.7 TO -0.3 BY 0.1; MODEL y=K/(1+EXP(A+B*x)); TMP=1+EXP(A+B*x); DER.K=1/TMP;

DER.A=-K/TMP/TMP*(TMP-1); DER.B=DER.A*x;

OUTPUT OUT=RESULT2 PREDICTED=YPREDICT RESIDUAL=RESIDUAL; RUN;

PROC PRINT DATA=RESULT1; RUN;

PROC PRINT DATA=RESULT2; RUN;

? 输出结果及说明

Non-Linear Least Squares Grid Search Dependent Variable Y K A B Sum of Squares 665.000000 4.000000 -0.500000 2610.748511 664.000000 4.000000 -0.500000 2815.946297

Non-Linear Least Squares Iterative Phase Dependent Variable Y Method: Marquardt

Iter K A B Sum of Squares 0 665.000000 4.000000 -0.500000 2610.748511 1 662.156407 4.244842 -0.543580 214.788008 2 663.034362 4.270190 -0.546912 194.328044 3 663.022349 4.270751 -0.546993 194.325380 4 663.021999 4.270764 -0.546995 194.325378 NOTE: Convergence criterion met.

Non-Linear Least Squares Summary Statistics Dependent Variable Y Source DF Sum of Squares Mean Square Regression 3 3901185.9646 1300395.3215 Residual 16 194.3254 12.1453 Uncorrected Total 19 3901380.2900 (Corrected Total) 18 1259943.1063

10-13

Parameter Estimate Asymptotic Asymptotic 95 % Std. Error Confidence Interval Lower Upper K 663.0219991 1.7027288095 659.41239320 666.63160497 A 4.2707636 0.0408955224 4.18406944 4.35745784 B -0.5469947 0.0055826647 -0.55882934 -0.53516002

Asymptotic Correlation Matrix

Corr K A B K 1 -0.41601756 0.5659244708 A -0.41601756 1 -0.960157131 B 0.5659244708 -0.960157131 1

OBS _TYPE_ _NAME_ _ITER_ _SSE_ K A B 1 GRID -1 516725.68 660.000 3.00000 -0.70000 2 GRID -1 520048.35 661.000 3.00000 -0.70000 ? ? ? ? ? ? ?

90 GRID -1 1792713.09 665.000 5.00000 -0.30000 91 ITER 0 2610.75 665.000 4.00000 -0.50000 92 ITER 1 214.79 662.156 4.24484 -0.54358 93 ITER 2 194.33 663.034 4.27019 -0.54691 94 ITER 3 194.33 663.022 4.27075 -0.54699 95 ITER 4 194.33 663.022 4.27076 -0.54699 96 FINAL . 194.33 663.022 4.27076 -0.54699 97 COVB K . 194.33 2.899 -0.02897 0.00538 98 COVB A . 194.33 -0.029 0.00167 -0.00022 99 COVB B . 194.33 0.005 -0.00022 0.00003

OBS X Y YPREDICT RESIDUAL 1 0 9.6 9.136 0.46448 2 1 18.3 15.630 2.67014 3 2 29.0 26.553 2.44652 4 3 47.2 44.586 2.61424 5 4 71.1 73.450 -2.35046 6 5 119.1 117.453 1.64692 7 6 174.6 179.778 -5.17845 8 7 257.3 259.448 -2.14843 9 8 350.7 348.931 1.76861 10 9 441.0 435.939 5.06074 11 10 513.3 509.452 3.84752 12 11 559.7 564.543 -4.84339 13 12 594.8 602.230 -7.42952 14 13 629.4 626.429 2.97139 15 14 640.8 641.342 -0.54177 16 15 651.1 650.301 0.79931 17 16 655.9 655.600 0.29964 18 17 659.6 658.707 0.89315 19 18 661.8 660.518 1.28199

10-14

程序2 DUD法求解LOGISTIC模型的参数。

DATA NEW; INPUT x y; Cards;

0 9.6 1 18.3 2 29.0 3 47.2 4 71.1 5 119.1 6 174.6 7 257.3 8 350.7 9 441.0 10 513.3 11 559.7 12 594.8 13 629.4 14 640.8 15 651.1 16 655.9 17 659.6 18 661.8

PROC NLIN METHOD=DUD BEST=2; PARMS K=661 TO 665 BY 2 A=3 TO 5

B=-0.6 TO -0.4 BY 0.1; MODEL y=K/(1+EXP(A+B*x)); RUN;

程序3 MARQUARDT法求解RICHARDS模型的参数。

DATA NEW; INPUT x y; Cards;

0 9.6 1 18.3 2 29.0 3 47.2 4 71.1 5 119.1 6 174.6 7 257.3 8 350.7 9 441.0 10 513.3 11 559.7 12 594.8 13 629.4 14 640.8 15 651.1

10-15


第10章 回归分析(3).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:城市管理执法大队养犬管理专项整治工作总结

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: