H0:?2?5000
2H:??5000 1222??5000?n?26??0.05s?92000已知,,,,采用检验统计量。
??2(n?1)s2?02?(26?1)?9200?465000
??0.05,
?2?/2(n?1)??20.025(25)?40.6465,?21??/2(n?1)??20.975(25)?13.1197
22????/2,所以拒绝原假设H0,即这批电池的波动性较以往是有显著的变化。 因为
第七章 方差分析
(以下均为Excel输出结果)
【7.1】有某种型号的电池,他们分别为甲、乙、丙三个工厂所生产的。为评比其质量,各随机抽取5只电池为样本,经试验测得其寿命(单位:小时)如下:
试验号 1 2 3 4 5 甲 49 50 39 40 43 电池生产企业 乙 28 32 30 26 34 丙 38 40 45 42 48 要求:检验三个工厂的电池平均寿命有无显著的差异?(?【解】方差分析表 差异源 组间 组内 总计
SS 604.9333
206
810.9333
df
2 12
MS
F
?0.05)
P-value
F crit
302.4667 17.61942 0.000269 3.885294 17.16667 14
由于P-value=0.000269<0.05,说明拒绝原假设,表明三个工厂的电池平均寿命有显著差异。 【7.2】某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了20名工人,并指定每个人使用其中的一种方法。通过对每个工人生产的
- 21 -
产品数进行方差分析得到下表的结果。 差异源 组间 组内 总计 SS 1904 df 19 MS 435 F P-value 0.0325 F crit 3.592 要求:完成上面的方差分析表,并检验三种方法组装的产品数量之间是否有显著差异?(??0.05)
SS df MS 435 F P-value 0.0325 F crit 3.592 【解】 差异源 组间 组内 总计 870 1904 2 17 19 3.8118 114.118 由于P-value=0.0325<0.05,说明拒绝原假设,表明三种方法组装的产品数量之间有显著差异。
【7.3】为比较四种不同品牌的汽车使用相同类型汽油时的耗油量,在相同的行驶条件下,不同品牌汽车测得每加仑汽油所行使的里程数如下表:
品牌1 15 12 14 15 12 要求:分析四种不同品牌的车耗油量是否有显著差异?(?【解】方差分析表 差异源 组间 组内 总计
SS 53.50098 32.61667
86.11765
df
3 13
MS
F
P-value
F crit
17.83366 7.107948 0.004523 3.410534 2.508974 16 品牌2 11 12 13 9 品牌3 14 13 11 品牌4 17 18 16 14 15 ?0.05)
由于P-value=0.004523<0.05,说明拒绝原假设,表明四种不同品牌的车耗油量之间有显著差异。
- 22 -
【7.4】有4种不同的种子和5种不同施肥方案,在20块同样面积的土地上,分别用4种不同的种子和5种不同施肥方案搭配进行试验,取得的收获量数据见下表:
品牌 1 2 3 4 1 12.0 13.7 14.3 14.2 2 13.0 9.5 11.5 12.3 施肥方案 3 10.4 12.4 11.3 12.5 4 9.7 9.6 11.1 12.0 5 11.4 12.5 10.9 9.8 要求:检验种子的不同品种对收获量的影响是否有显著差异?不同的施肥量方案对收获量的影响是否有显著差异?(?【解】方差分析表 差异源 行 列 误差 总计
SS 2.0575 19.812 18.98
40.8495
df
MS
F
P-value
F crit 3.490295 3.259167
3 0.685833 0.433614 0.732851 4 4.953 3.131507 0.055759 12 1.581667
19
?0.05)
由于行因素的P-value=0.732851>0.05,说明不能拒绝原假设,表明没有证据证明不同品种的种子对收获量有显著的影响;由于列因素的P-value=0.055759>0.05,说明不能拒绝原假设,表明没有证据证明不同施肥量方案对收获量有显著的影响。
【7.5】某金属材料生产过程中,为提高其强度,需要进行热处理。热处理的温度和时间是影响该材料强度的两个主要因素。现取三个温度水平和四个时间水平,各个不同水平的每一组合都进行了二次试验,测得该材料在各种热处理方式下的强度数据如下表。试分析温度、时间两个因素各自以及两个因素的交互作用对材料强度是否显著地影响。(? B1 温 度 A A2 A1 53 56 71 68 B2 69 71 77 78 时间B B3 63 64 69 70 B4 56 59 58 59 ?0.05)
- 23 -
A3 75 76 72 71 68 66 56 58 【解】方差分析 差异源 样本 列 交互 内部 总计
SS 256.0833 714.7917 313.5833
22.5
1306.958
df
2 3 6 12
MS
F
P-value
F crit
128.0417 68.28889 2.78E-07 3.885294 238.2639 127.0741 2.34E-09 3.490295 52.26389 27.87407 2.24E-06 2.99612 1.875 23
由于行因素的P-value=2.78E-07<0.05,说明拒绝原假设,表明温度因素对材料强度有
显著的影响;由于列因素的P-value=2.34E-09<0.05,说明拒绝原假设,表明时间因素对材料强度有显著的影响;交互作用的P-value=2.24E-06<0.05,说明拒绝原假设,表明温度和时间两个因素的交互作用对材料的强度有显著影响。
第八章 相关分析和回归分析*
【8.1】某店主分析其店面的经营情况时,收集了连续10天的访问量数据(单位:天)和当天营业额数据(单位:元)如下。 编号 1 2 3 4 5 访问量 74 66 88 69 91 营业额 130 100 130 110 160 编号 6 7 8 9 10 访问量 73 66 96 58 73 营业额 90 70 140 50 100 对以上访问量和营业额数据作相关分析。 【解】相关分析
(1)画访问量和营业额数据的散点图,如下所示
图表标题180160140120100806040200020406080100120访问量
从图上可以看出,访问量和营业额数据是简单线性正的不完全相关。 (2)计算相关系数
计算访问量和营业额的简单线性相关系数为0.871508,大于0.8,说明访问量和营业额之间存在较高的线性关系。
【8.2】某饮料广告费投入为x,产品销售数量为y,根据收集2年的月度数据 资料,计算得到以下结果:
- 24 -
?(x?x)i2?6546,?(yi?y)2?5641
x?375,y?498,?(xi?x)(yi?y)?6054
(1)计算相关系数,并初步判断x与y之间的关系; (2)用最小二乘法估计模型回归系数,并写出模型结果; (3)说明所计算的回归系数的经济意义;
(4)计算模型可决系数,并用其说明模型的拟合效果。 【解】最小二乘法的计算(一元)
(1)计算相关系数,并初步判断x与y之间的关系;
计算x与y相关系数为r=0.996268,说明两者的简单线性相关程度非常高,因此可以初步判断x与y呈现线性关系。
(2)用最小二乘法估计模型回归系数,并写出模型结果;
????x,??0.92484,?i??记模型为:y得到?101i将以上结果代入最小二乘法的计算公式,??151.1852。 ?0?i?151.1852?0.92484因此,产品销售数量为y对广告费投入为x的模型为yxi
(3)说明所计算的回归系数的经济意义;
??0.92484表示当广告费投入每增加1个单位,产品销售数量会增加0.92484个单位。 ?1(4)计算模型可决系数,并用其说明模型的拟合效果。
由于模型为一元线性回归模型,根据一元线性回归模型中可决系数为模型因变量和自变
2
2
2
量简单线性相关系数的平方的关系,可得模型的可决系数R=(r)=(0.996268)=0.99255。可决系数接近1,说明模型拟合的非常好。
【8.3】人们的收入期望往往受其教育程度和工作经验的影响,随机抽取了50名25-40岁之间的社会工作人员,收集了他们的月工资(单位:元)、受教育年限(单位:年,从小学开始计算,到最高学历为止,并扣除中间间断的时间)和工作年限(单位:年,按照毕业之后,开始工作时计算起)的数据,进行计算得到方差分析表和参数估计的结果如下所示。
方差分析表 误差来源 回归分析 残差 总计 变量 受教育年限 工作年限 常数项 df 系数 339.57 127.29 1278.78 SS 6703 6745 MS —— F —— —— t统计量 15.29 13.79 55.52 Significance F —— —— —— Prob. 0.0000 0.0000 0.0000 参数估计表 标准误差 22.20 9.23 23.03 要求:
(1)根据参数估计表,说明收入期望与受教育程度和工作经验的关系;
(2)根据参数估计表,说明受教育程度和工作经验对收入期望是否有显著影响; (2)完成以上方差分析表,对模型进行F检验;
- 25 -