106730947.doc
商务数据分析
电子商务系列 Model: MODEL1 NOTE: Restrictions have been applied to parameter estimates. Dependent Variable: OXYGEN Analysis of Variance Sum of Mean Source DF Squares Square F Value Prob>F Model 4 713.71590 178.42897 33.699 0.0001 Error 26 137.66565 5.29483 C Total 30 851.38154 Root MSE 2.30105 R-square 0.8383 Dep Mean 47.37581 Adj R-sq 0.8134 C.V. 4.85702 Parameter Estimates Parameter Standard T for H0: Variable DF Estimate Error Parameter=0 Prob > |T| Type II SS INTERCEP 1 89.487420 6.56417198 13.633 0.0001 984.048068 AGE 1 -0.162973 0.08527433 -1.911 0.0671 19.339463 输出结果分析:注意到参数估计表中,maxpulse变量的系数为0.388260 , runpulse变量的系数为-0.388260,两者之和为0。同时,它们的类型2平方和也相等为57.444946。没有约束条件时的RSS=721.97309,增加约束条件后的RSS=713.71590,减少了721.97309-713.71590=8.257198,说明为了增加这个约束条件损失了回归平方和8.257198,但换来了简化的回归模型。显然,这个数值越小越表明这个约束条件客观存在。所以,restrict语句的类型II平方和为8.257198,且自由度为-1(是减少不是增加)。同时,注意到这个8.257198数字就是表32.13中的分子值。现在拟合的回归方程可以写成:
oxygen= 89.487420-0.162973age + 0.388260 (maxpulse-runpulse)-2.805552
runtime-0.080635weight
自变量系数存在线性组合的约束条件,本质上是指这些自变量可以通过这种组合方式转换为一个新的简单自变量,例如,在这个样本中产生一个新变量maxrun=maxpulse-runpulse,这个新变量maxrun加入到回归模型中,而变量maxpulse和runpulse从回归模型中删除,重新拟合回归模型。程序如下:
data fitness2;
set fitness;
maxrun=maxpulse-runpulse; run;
proc reg data= fitness2;
model oxygen=age maxrun runtime weight/ss1 ss2; run ;
程序运行后,得到表32.15所示的输出结果。
上海财经大学经济信息管理系IS/SHUFE
Page 26 of 27
106730947.doc
商务数据分析
电子商务系列
表32.15 合并成新变量maxrun后的回归分析结果
Model: MODEL1 Dependent Variable: OXYGEN Analysis of Variance Sum of Mean Source DF Squares Square F Value Prob>F Model 4 713.71590 178.42897 33.699 0.0001 Error 26 137.66565 5.29483 C Total 30 851.38154 Root MSE 2.30105 R-square 0.8383 Dep Mean 47.37581 Adj R-sq 0.8134 C.V. 4.85702 Parameter Estimates Parameter Standard T for H0: Variable DF Estimate Error Parameter=0 Prob > |T| Type I SS Type II SS 输出结果分析:回归后的自变量maxrun的参数系数为0.388260,Type II SS为57.444946,RSS= 713.71590,与表32.14所示的输出结果比较,完全相同。
上海财经大学经济信息管理系IS/SHUFE
Page 27 of 27