上表给出了各分析变量和控制变量的描述统计量。
Correlations Control Variables -none- a产量 Correlation Significance (2-tailed) df 1.000 . 0 .981 .000 8 .986 .000 8 1.000 . 0 .780 .013 7 降雨量 .981 .000 8 1.000 . 0 .957 .000 8 .780 .013 7 1.000 . 0 温度 .986 .000 8 .957 .000 8 1.000 . 0 产量 降雨量 Correlation Significance (2-tailed) df 温度 Correlation Significance (2-tailed) df 温度 产量 Correlation Significance (2-tailed) df 降雨量 Correlation Significance (2-tailed) df a. Cells contain zero-order (Pearson) correlations.
上表下半部分给出了当控制“温度”这一变量时,“产量”和“降雨量”之间的偏相关系数、自由度和显著性P值。结果显示,二者的偏相关系数为0.78,尽管比相关系数0.981小,但统计检验显示两者的偏相关系数在0.05水平上显著,也就是说产量和降雨量确实存在显著正相关
(4) 对6个标准电子元件的电阻(欧姆)进行3次平行测试,测得结果如下表所示。请应用距离相关分析测试结果是否一致。
序号 第一次 第二次 第三次 1 0.140 0.135 0.141 2 0.138 0.140 0.142 3 0.143 0.142 0.137 4 0.141 0.136 0.140 5 0.144 0.138 0.142 6 0.137 0.140 0.143 解:
① 操作步骤:
步骤一:将数据输入到SPSS数据编辑框中。
步骤二:在SPSS主菜单单击Analyze错误!未找到引用源。Correlate错误!未找到引用源。Distance…,打开Distance主对话框。
步骤三:在弹出的Distances对话框中,在对话框左侧的变量列表中选择所有变量,使之添加到Variables框中,对三此测试进行距离相关分析。在Compute Distance 单选框组中选择Between Cases单选框。在Measure单选框组中选择Dissmilarities单选框。
步骤四:单击Measure按钮,弹出Distance:Dissimilarity Measures对话框。在Interval下拉列表中选择Euclidean distance。
② 结果分析:
Case Processing Summary Cases Valid N 3 Percent 100.0% N 0 Missing Percent .0% N 3 Total Percent 100.0%
Proximity Matrix 1 2 3 1 Euclidean Distance 2 .010 .000 .010 3 .010 .010 .000 .000 .010 .010 This is a dissimilarity matrix
该距离相关分析采用的是不相关测度,上表列出了变量之间的不相似性分析结果,当两case间的欧式距离越大,说明其差别越大。反之亦然。由表格可见,三个case间的差别非常小,可视为测试结果一致。
习题8
(1) 随着公司的持续发展,常常有滑入无效率困境的危险,假定若干年后公司的销售开始滑坡,但公司还是不停地招聘新人,这种情况在某个10年中的数据会与下表给出的数据相似。根据这些数据,以销售额为自变量,员工数为因变量画出散点图,并建立一个回归模型,通过员工的数量来预测销售额。根据你的分析结果回答:如果这个趋势继续下去,你对公司的管理层有何建议?你认为管
理层应该关注什么?
年序号 1 2 3 4 5 6 7 8 9 10
销售额(百万美元)
20.2 24.3 28.6 33.4 35.2 35.9 36.3 36.2 36.5 36.4
员工数 120 135 142 150 155 168 172 170 175 174
解:
得到的散点图如下图所示,由散点图看出两变量之间有明显的线性关系。
通过SPSS操作,得到如下所示结果,操作步骤略(与书中案例同)。
Model Summary Adjusted R Model 1 R .954 aStd. Error of the Estimate 6.04434 R Square .910 Square .899 a. Predictors: (Constant), 销售额
由上表中判定系数为0.954,可知自变量与因变量的关系非常密切。
ANOVA Model 1 Regression Residual Total Sum of Squares 2958.627 292.273 3250.900 df 1 8 9 Mean Square 2958.627 36.534 F 80.983 Sig. .000 ab a. Predictors: (Constant), 销售额 b. Dependent Variable: 员工数
由上表中,统计量F=80.983,回归模型的Sig.值为0,说明该模型有显著的统计意义,自变量x与因变量y之间确有线性回归关系
Coefficients Standardized Unstandardized Coefficients Model 1 (Constant) 销售额 B 56.689 3.078 Std. Error 11.211 .342 Coefficients Beta t 5.057 8.999 Sig. .001 .000 a .954 a. Dependent Variable: 员工数
由上表,常数项和销售额所对应的系数其t检验的Sig.值都为0,说明回归系数与0有显著差别,具有显著的统计学意义。
??56.689,回归系数从表格中可以看出估计值及其检验结果,常数项?0??3.078,回归系数检验统计量t=8.999。所以得出例8-8的拟合结果为 ?1??56.689?3.078x y建议请读者独立思考,这里不多做解答。
(2) 某农场通过试验取得早稻收获了与春季降雨量和春季温度的数据如下:
收获量(公斤/公顷)y
2250 3450 4500 6750 7200
降雨量(毫米)x1
25 33 45 105 110
温度(℃)x2
6 8 10 13 14
7500 8250 115 120 16 17
① 试确定早稻收获量对春季降雨量和春季温度的二元线性回归方程; ② 解释回归系数的实际意义;
③ 根据你的判断,模型中是否存在多重共线性? 解:
① 操作步骤(略)。
Variables Entered/Removed Model 1 Variables Entered 温度, 降雨量 abVariables Removed . Method Enter a. All requested variables entered. b. Dependent Variable: 收获量
Model Summary Model 1 R .996 aR Square .991 Adjusted R Square .987 Std. Error of the Estimate 261.43103 a. Predictors: (Constant), 温度, 降雨量 b
ANOVA Model 1 Regression Residual Total Sum of Squares 3.123E7 273384.743 3.150E7 df 2 4 6 Mean Square 1.561E7 68346.186 F 228.444 Sig. .000 a a. Predictors: (Constant), 温度, 降雨量 b. Dependent Variable: 收获量
Coefficients Standardized Unstandardized Coefficients Model 1 (Constant) B -.591 Std. Error 505.004 Coefficients Beta t -.001 Sig. .999 a