16 655.9 17 659.6 18 661.8
PROC NLIN METHOD=MARQUARDT BEST=2; PARMS K=661 TO 665 BY 2 A=3 TO 5
B=-0.6 TO -0.4 BY 0.1 C=0.8 TO 1.2 BY 0.2;
MODEL Y=K/(1+EXP(A+B*x))**(1/C); TMP1=1+EXP(A+B*x); TMP2=-1/C;
DER.K=TMP1**TMP2;
DER.A=K*TMP1**(TMP2-1)*TMP2*(TMP1-1); DER.B=DER.A*x;
DER.C=K*TMP1**TMP2*LOG(TMP1)*TMP2**2;
OUTPUT OUT=RESULT PREDICTED=YPREDICT RESIDUAL=RESIDUAL; RUN;
PROC PRINT DATA=RESULT; RUN;
程序4 DUD法求解RICHARDS模型的参数。
DATA NEW; INPUT x y; Cards;
0 9.6 1 18.3 2 29.0 3 47.2 4 71.1 5 119.1 6 174.6 7 257.3 8 350.7 9 441.0 10 513.3 11 559.7 12 594.8 13 629.4 14 640.8 15 651.1 16 655.9 17 659.6 18 661.8 RUN;
PROC NLIN METHOD=DUD BEST=2; PARMS K=661 TO 665 BY 2 A=3 TO 5
B=-0.6 TO -0.4 BY 0.1 C=0.8 TO 1.2 BY 0.2;
MODEL y=K/(1+EXP(A+B*x))**(1/C);
10-16
OUTPUT OUT=RESULT PREDICTED=YPREDICT RESIDUAL=RESIDUAL; RUN;
PROC PRINT DATA=RESULT; RUN;
§10.5 多项式回归分析过程RSREG
在实际工作中,多变量之间的关系并非都是线性的,这就引起了多元非线性回归问题。通常寻求多元非线性回归模型的函数表达式比较困难,这时往往采用多项式去拟合回归方程。因为任何一个连续可导函数都可以分段用多项式去逼近。在研究比较复杂的实际问题时,不管自变量与依变量的关系如何复杂,都可用多项式口归进行分析计算。
10.5.1 RSREG过程的格式
PROC RSREG选择项;
MODEL 因变量=自变量/选择项; RIDGE选择项; WEIGHT 变量; ID变量表; BY变量表;
除PROC RSREG和MODEL语句外,其他均为可选语句。
10.5.2 语句说明
1.PROC RSREG语句
有三个选择项:
DATA=数据集 指定输入数据集,缺省时为最新建立的数据集。
OUT=数据集 指定输出数据集,用于储存对输入数据集中各观察值的统计信息。
注意如果需要在该数据集中储存某些统计信息,必须在MODEL语句的选择项中进行指定,否则虽然建立了数据集,但不会有任何观察值。
NOPRINT不输出任何分析结果。 2.MODEL语句
MODEL语句的选项主要包括3类: (1)指定模型拟合方法
LACKFIT要求进行拟合不适度测验(Lack of Fit Test)。若选用此项,则须先将自变量排序。
COVER=n指定模型中前n个自变量为共变量,即简单回归自变量,它们只以一次项形态进入回归模型。
10-17
BYOUT此选项与BY语句并用。利用BY语句将原数据集分组,如:早播。晚播或高肥、低肥,然后只根据第一组(即早播、高肥)的数据来估计回归系数。
(2)指定OUT数据集所包含的统计信息 ACTUAL 输入数据集中的原始数据;
PREDICT 依变量的预测值(不可省略为P) ; RESIDUAL 预测残差(不可省略为R) ;
U95M、L95M 依变量预测平均数的95%置信区问上下限;
U95、L95 依变量预测值(以观察值为单位)95%置信区间上下限; D CooK’S 影响力统计量D。 (3)控制输出结果
NOANOVA(或NOAOV) 禁止输出方差分析和参数估计值。
NOOPTIMAL(或NOOPT) 禁止输出二次响应面的典型分析结果。 NOPRINT 是NOAOV和NOOPT两选项的联合效果。 3.RIDGE语句
这个语句的功能是进行岭分析。一般而言,若模型所代表的响应面已经包含了一个最优解,则不必考虑进行该分析。但当最优解可能位于现有响应面范围之外,则该分析可帮助寻找最优解的方向。其选项有:MIN、MAX、CENTER RADIUS OUTR等。
4.与PROC RSREG语句配合应用的其他常用语句
WEIGHT、ID、BY语句作用同PROC REG过程。
10.5.3 输出说明
(1)RESPONSE SURFACE FOR VARIABLE响应曲面。其中输出的项有: RESPONSE MEAN样本中响应变量的均值。 ROOT MSE响应变量的标准误。
R-OUARE决定系数,度量由模型而不是随机误差引起的响应变异比例。 COEF OF VARIATION 变异系数,其值等于100(ROOT MSE)/(RESPON MRAN)。 (2)REGRESSION回归,其中包括: INTERCEPT 截距。 LINEAR 一次项。
QUADRATIC 平方项。
CROSSPRODUCT 叉积项。
TOTAL REGRESS 总回归,为上述各项之和。 (3)DF 自由度。
(4)TYPE I SS 称为序贯平方和,各项误差平方和的度量。 (5)R_SQUARE各项在总的R_SQUARE中的贡献。
(6)F_RATIO用于检验各项中参数为零的假设检验的下值,总误差均方作为分母。 (7)PROB>F显著水平。
10-18
(8)RESIDUAL 残差分析,LACK OF FIT(拟合不佳)和PURE ERROR(纯误差)两项构成TOTAL ERROR(总误差),当LACK OF FIT项显著时,说明模型中变异不是随机误差造成的。
(9)PARAMETER ESTIMATE 参数估计。
(10)STANDARD ERROR 参数估计的估计标准误。
(11)T FOR HO:PARAMETER=0 参数为零的假设检验T值。 (12)PROB 显著水平。
(13)FACTOR 因子检验。检验各因子及与其有关的平方项。交叉项的系数均为零假设。
(14)CRITICAL VALUES 因子变量的临界值,以便找出最优响应曲面的稳定点。临界值可能是最小。最大或鞍点。
(15)ELGENVALUES EIGENVECTORS 次参数估计矩阵的特征值及特征向量,它们决定响应曲面的形状。
10.5.4 应用事例
例10.5 有一大麦氮磷肥用量配比试验,施氮量m(公斤/亩)为五个水平,施磷量n(公斤/亩)为四个水平。测得氮磷肥配比试验平均产量Y(公斤/亩),试建立Y与X1及X2的二元二次回归方程。
x1 x2 0 2 4 6 0.0 2.5 5.0 7.5 10.0 84.5 100.0 142.0 175.5 161.0 105.5 131.5 165.5 193.0 172.0 156.0 177.0 211.0 245.0 233.5 154.0 188.0 217.0 255.0 235.5 程序如下:
DATA new;
INPUT x1 x2 y@@;
label x1=\氮\磷\产量\ CARDS;
0.0 0 84.5 0.0 2 105.5 0.0 4 156.0 0.0 6 154.0 2.5 0 100.0 2.5 2 131.5 2.5 4 177.0 2.5 6 188.0 5.0 0 142.0 5.0 2 165.5 5.0 4 211.0 5.0 6 217.0 7.5 0 175.5 7.5 2 193.0 7.5 4 245.0 7.5 6 255.0 10.0 0 161.0 10.0 2 172.0 10.0 4 233.5 10.0 6 235.5 PROC RSREG;
MODEL y=x1 x2; RUN;
结果如下:
10-19
Coding Coefficients for the Independent Variables Factor Subtracted off Divided by X1 5.000000 5.000000 X2 3.000000 3.000000 Response Surface for Variable Y: 产量 Response Mean 175.125000 Root MSE 15.111235 R-Square 0.9284 Coef. of Variation 8.6288 Degrees
of Type I Sum
Regression Freedom of Squares R-Square F-Ratio Prob > F Linear 2 39193 0.8775 85.817 0.0000 Quadratic 2 2268.598214 0.0508 4.967 0.0234 Crossproduct 1 5.445000 0.0001 0.0238 0.8795 Total Regress 5 41467 0.9284 36.319 0.0000 Degrees
of Sum of
Residual Freedom Squares Mean Square Total Error 14 3196.891786 228.349413
Parameter
Degrees from Coded
Parameter Freedom Estimate Error Parameter=0 Prob > |T| Data INTERCEPT 1 74.147857 11.119123 6.668 0.0000 191.825893 X1 1 18.047714 3.605044 5.006 0.0002 43.800000 X2 1 19.627500 5.704366 3.441 0.0040 42.435000 X1*X1 1 -0.948571 0.323092 -2.936 0.0108 -23.714286 X2*X1 1 0.066000 0.427410 0.154 0.8795 0.990000 X2*X2 1 -0.968750 0.844744 -1.147 0.2707 -8.718750 Degrees
of Sum of
Factor Freedom Squares Mean Square F-Ratio Prob > F X1 3 21158 7052.710238 30.886 0.0000 氮 X2 3 20314 6771.286667 29.653 0.0000 磷
10-20
Estimate of Parameter Standard T for H0: