并以0.05的显著性水平检验相关系数的显著性。
表8—19
体重(千克) 体表面积(10平方米) ?111.0 11.8 12.0 12.3 13.1 13.7 14.4 14.9 15.2 16.0 5.3 5.3 5.4 5.64 5.3 6.0 5.8 6.1 6.1 6.4 参考答案:
(1)用Excel计算相关系数,结果为
儿童体重与体表面积的相关系数为rXY=0.912 081,说明相关程度较高。 (2)计算t统计量:
t?rn?21?r2?0.912081?10?21?0.9120812?2.57975464=6.291 930 289
0.410010048给定显著性水平=0.05,查t分布表得自由度n—2=10—2=8的临界值ta/2为2.306,显然t>ta/2,表明相关系数r在统计上是显著的。
50.某商业企业1997—2001年五年内商品销售额的年平均数为421万元,标准差为30.07万元;商业利润的年平均数为113万元,标准差为15.41万元;五年内销售额与商业利润的乘积和为240 170万元,各年销售额的平方和为890 725万元,各年商业利润的平方和为65 033万元。试就以上资料计算:
(1)商业销售额与商业利润的样本相关系数并解释其含义。
(2)其他条件不变时,估计当商品销售额为600万元时,商业利润可能为多少万元。 参考答案:
设商品销售额为X,商业利润为Y,根据所给条件有:
X=421;∑X=X·n=421×5=2 105;∑X2=890 725;
Y=113;∑Y=Y·n=113×5=565;∑Y=65 033 ∑XY=240 170 样本相关系数为
2
2
r?n?XiYi??Xi?Yin?Xi?(?Xi)22n?Yi?(?Yi)22
=5?240170?2105?5655?890725?210525?65033?5652?11525=0.99470
11585.93说明商业销售额与商业利润是高度线性相关的。 对于回归模型Yt?a??Xt?ut估计参数为
n?XiYi??Xi?Yi5?240170?2105?565????=0.50996 2225?890725?2105n?Xi?(?Xi)?X=113—0.509 96×421=-101.693 2 ??Y???
31
???101.6932?0.50996X 即Ytt其他条件不变时,估计当商品销售额为600万元时,商业利润可能为
?=—101.693 2+0.509 96×600=204.282 8(万元) Yt
51.假设某地区住宅建筑面积与建造单位成本的有关资料如表:
建筑地编号 1 2 3 4 5 6 7 8 9 10 11 12 建筑面积(万平方米)X 0.6 0.95 1.45 2.1 2.56 3.54 3.89 4.37 4.82 5.66 6.11 6.23 建造单位成本(元/平方米)Y 1860 1750 1710 1690 1678 1640 1620 1576 1566 1498 1425 1419 根据上表资料:
(1)建立建筑面积与建造单位成本的回归方程。 (2)解释回归系数的经济意义。
(3)估计当建筑面积为4.5万平方米时,建造单位成本可能为多少。 参考答案:
(1)建立建筑面积X与建造单位成本y的回归方程: Yi????Xi?u i估计参数得出结果如表所示。
summary output
回归统计
Multiple R R Square Adjusted R Square 标准误差 观测值 方差分析 回归分析 残 差 总 计
32
0.973 051 0.946 829 0.941 512 31.736 12 SS 179 348.9 10 071.74 189 420.7 MS 179 348.9 1 007.174 F 178.071 5 df 1 10 11 Intercept X Variable 1 即
Coefficients 1 845.475 —64.184 标准误差 19.264 46 4.809 828 t Stat 95.796 88 —13.344 3 P—value 3.76E—16 1.07E—07 ??1845.4 Y?75i 8464.Xi1X的参数的t检验显著,拟合优度0.946 829较高。
(2)解释回归系数的经济意义:回归系数—64.184说明建筑面积每增加1万平方米,平均说来,每平方米建造单位成本将降低64.184元。
(3)估计当建筑面积为4.5万平方米时,建造单位成本可能为
?i?1845.47 Y?564.?18=1 55644..5647(元)
52.若X表示在一家分店工作的售货员人数,Y表示这家分店的年销售额 (千元),已经求出Y对X的回归方程的估计结果如表8—21所示。
表8—21
预测量 常数 X 方差分析
离差来源 回归 残差 总离差 平方和 6 828.6 2 298.8 9 127.4 自由度 1 28 29 方差 6 828.6 82.1 系数 80.0 50.0 标准差 11.333 5.482 t值 7.06 9.12 (1)写出估计的回归方程。 (2)在研究中涉及多少家分店?
(3)计算F统计量,在0.05显著性水平下检验关系的显著性。 (4)预测有12名售货员的某分店的年销售收入。 参考答案:
??80.0?50.00X (1)估计的回归方程为Yii(2)在研究中涉及30家分店。 (3)F统计量为F=
6828.6=83.17 82.1临界值F?(k?1,n?k)=4.2
因为F=83.17>4.2,所以在0.05的显著性水平下,分店销售额与售货员人数的关系是显著的。
(4)预测:有12名售货员的某分店的年销售收入预测值为
??80.? Y0i80.0+50.00 *12=680(千元) 50.X00i=
53.某村从部分地块测得水稻产量y和施肥量X的有关数据如表所示。
33
地块 1 2 3 4 5 6 7 8 9 水稻亩产量(千克) 140 210 280 350 420 490 510 500 480 每亩施肥量X(千克) 0 10 20 30 40 50 60 70 80 分别建立水稻产量Y和施肥量X的线性回归方程和二次抛物线回归方程,并对比这两个回归方程,哪个方程更理想?
参考答案:
(1)建立线性回归模型:Yi?a?bXi?ui 回归估计Excel输出结果如表8—29所示。
表8—29
summary output
回归统计
Multiple R R Square Adjusted R Square 标准误差 观测值 方差分析 回归分析 残 差 总 计 Intercept X Variable 1 Coefficients 1 86.8889 4.716667 标准误差 31.80244 0.667985 t Stat 5.876559 7.061039 P—value 0.000614 0.0002 df 1 7 8 SS 133481.7 18740.56 152222.2 MS 133481.7 2677.222 F 49.85827 0.936422 0.876887 0.859299 51.74188 9 (2)建立二次抛物线回归方程: Yi?a?bXi?cXi2?ui 回归估计Excel输出结果如表8—30所示。
表8—30 summary output
回归统计
Multiple R R Square Adjusted R Square 标准误差 观测值
0.991121 0.982321 0.976428 21.17848 9 34
方差分析
回归分析 残 差 总 计 Intercept X Variable 1 X Variable 2 Coefficients 119.5152 10.49156 -0.07219 标准误差 17.21338 1.003375 0.012068 t Stat 6.943155 10.45627 -5.98183 P—value 0.000443 4.49E-05 0.00098 df 2 6 8 SS 149531.1 2691.169 152222.2 MS 74765.53 448.5281 F 166.6908 (3)对比以上两个回归方程可以看出:
线性回归方程的可决系数为0.876 887,F统计量为49.858 27,回归系数的t检验表明X对Y有显著影响。
二次抛物线回归方程的可决系数为0.982 321,修正的可决系数为0.976 428,F统计量为166.690 8,回归系数的t检验表明X和X对Y都有显著影响。
虽然这两个方程的参数z检验都显著,但二次抛物线回归方程修正的可决系数比线性回归方程高得多,且F统计量也比线性回归方程更大,说明二次抛物线回归方程比线性回归方程对样本拟合情况更好,因此二次抛物线回归方程更理想。
54.表8—23给出了每周家庭消费支出y(美元)与每周家庭的收入X(美元)的数据:
表8—23
每周收入(X) 80 100 120 140 160 180 200 220 240 260 每周消费支出(Y) 55,60,65,70,75 65,70,74,80,85,88 79,84,90,94,98 80,93,95,103,108,113,115 102,107,110,116,118,125 110,115,120,130,135,140 120,136,140,144,145 135,137,140,152,157,160,162 137,145,155,165,175,189 150,152,175,178,180,185,191 2(1)对每一收入水平,计算平均的消费支出,即条件期望。 (2)以收入为横轴,消费支出为纵轴,作散点图。
(3)你认为X与Y之间的关系如何?X与Y的均值之间的关系如何? (4)写出总体回归函数。
(5)总体回归函数是线性的还是非线性的? 参考答案:
(1)平均的消费支出,即条件期望如表8—31所示。 表8—3l X E(Y|Xi)
80 65 l00 77 120 89 140 101 160 113 180 125 200 137 220 149 240 161 260 173 35