根据样本数据计算,得n1=25,n2=16,x1=82,s1=56,x2=78,s2=49
22s2p2n1?1?s12??n1?1?s2?x1?x2??=53.308;t??n1?n2?2sp11?n1n2=1.711
求临界值:α=0.02时,临界点为t?
?n1?n2?2?=t0.02?39?=2.125,t<t?,故不能拒绝原假设
第9章 分类数据分析
结论:不能认为大学中男生的学习成绩比女生的学习成绩好。
9.1 经常购买 不购买 有时购买 低收入组 偏低收入组 偏高收入组 47(41.97) 74(66.68) 19(31.35) 140
高收入组 46(41.97) 57(66.68) 37(31.35) 140
158 251 118 527
25(38.98) 40(35.08) 69(61.92) 51(55.72) 36(29.11) 26(26.20) 117
130 第一步:提出假设: 或者 H0:PijH0:收入与购买习惯无关(相互独立);H1:收入与购买习惯有关(相互不独立)
?Pi?Pj;H1:Pij?Pi?Pj
Ni?NNj第二步:构建统计量: 利用公式:Eij?由?2先计算期望频次分布,如上表括号中数据。
???i?1j?1rccr(nij?Eij)2Eij?2((r?1)(c?1))得
=17.63 (p=0.007227)
2(n?E)(25?38.98)2(40?35.08)2ijij2??=????38.9835.08Eii?1j?1j第三步:求临界值:?0.1(6)?10.6446
(注意:①对于r×c列联表的自由度是:df=(r-1)×(c-1); ②按右侧检验方法) 第四步:决策: 因为?2cr2???i?1j?1(nij?Eij)2Eij=17.63大于?0.12?10.6446,所以拒绝H0
第五步:结论:所以收入与购买习惯有关
9.2 假设:H0:?12?0.1,?2?0.2,?3?0.3,?4?0.2,?5?0.2;H1:至少有一个不成立
n(fo?fe)2 统计量:????
fei?1(0.14?0.1)2(0.28?0.2)2(0.24?0.3)2(0.18?0.2)2(0.16?0.2)2????=0.07
0.10.20.30.20.2 临界值:?0.1(5?1)?7.7794 (P=0.9994)
2(fo?fe)22 决策:因为????0.07小于?0.1(4)?7.7794,所以不能拒绝原假设。
fei?12n结论:没有发生变化。
9.3
11
阅读习惯 大学以上 大学和大专 高中 高中以下 44
早上看 6(15.16) 13(17.91) 14(8.27) 17(8.66) 50 中午看 12(13.34) 16(15.76) 8(7.28) 8(7.62) 晚上看 38(28.80) 40(34.04) 11(15.71) 6(16.46) 95 有空看 21(19.70) 22(23.29) 9(10.75) 13(11.26) 65
第一步:提出假设:
H0:阅读习惯与其文化程度无关(相互独立);H1:(相互不独立)
第二步:构建统计量: 利用公式:Eij由?277 91 42 44 254
?Ni?NNj先计算期望频次分布,如上表括号中数据。
???i?1j?1rccr(nij?Eij)2Eij?2((r?1)(c?1))得
=36.8611 (p=0.00021)
2(n?E)(6?15.16)2(13?17.91)2ijij2??=????15.1617.91Eii?1j?1j第三步:求临界值:?0.05(9)?16.919 第四步:决策: 因为?22???i?1j?1cr(nij?Eij)2Eij大于?0.05(9),所以拒绝H0
2第五步:结论:所以阅读习惯与其文化程度有关
9.4 本科专业 专业一 专业二 专业三 其他专业 MBA所选课程 会计 31(24.08) 8(12.44) 12(15.65) 10(8.83) 统计 13(17.37) 16(8.97) 10(11.29) 5(6.37) 市场营销 16(18.55) 7(9.59) 17(12.06) 7(6.80) 60 31 39 22
61 44 47 152
(1)第一步:提出假设:H0:本科专业不影响读MBA期间所选课程(相互独立);H1:(相互不独立)
第二步:构建统计量:
利用公式:Eij由?2?Ni?NNj先计算期望频次分布,如上表括号中数据。
???i?1j?1rccr(nij?Eij)2Eij?2((r?1)(c?1))得
=14.7019 ((2)p=0.0227)
2(n?E)(31?24.08)2(13?17.91)2ijij2??=????24.0817.91Eii?1j?1j第三步:求临界值:?0.05(6)?12.5916 第四步:决策: 因为?22???i?1j?1cr(nij?Eij)2Eij大于?0.05(6),所以拒绝H0
2第五步:结论:本科专业影响读MBA期间所选课程
12
9.5
??v??217.63==0.1829;c?527n17.63?2==0.1799; 2??n17.63?527?2n?min[(r?1)(c?1)]=17.63=0.1293
527?2
13
第10章 方差分析
10.1
方差分析 差异源 组间 组内 总计
SS 618.9167 598
1216.917
11
df 2 9
MS 309.4583 66.44444
F
P-value
F crit
4.6574 0.040877 8.021517
因为F=4.6574<临界值,所以不能拒绝H0,有显著差异 10.2
方差分析 差异源 组间 组内 总计
SS 93.76812 26.66667
120.4348
df
MS
18 1.481481
22
F
P-value
F crit
4 23.44203 15.82337 1.02E-05 2.927744
因为F=15.52337>临界值,所以拒绝H0,不相等
10.3 一家牛奶公司有4台机器装填牛奶,每桶的容量为4L。下面是从4台机器中抽取的样本数据:
机器l 机器2 机器3 机器4 4.05 3.99 3.97 4.00 4.01 4.02 3.98 4.02 4.02 4.01 3.97 3.99 4.04 3.99 3.95 4.0l 4.00 4.00 4.00 取显著性水平a=0.01,检验4台机器的装填量是否相同? 解:ANOVA 每桶容量(L) 组间 组内 总数
不相同。 10.4
方差分析 差异源 组间 组内 总计 有显著差异 10.5
方差分析 差异源 组间 组内
SS 615.6 216.4 SS 29.60952 18.89048
48.5
平方和 df 0.007 3 0.004 15
0.01
18
1 均方 0.002 0.000
F 8.721
显著性 0.001
df
MS
F
P-value
F crit 3.68232
2 14.80476 11.75573 0.000849 15 1.259365
17
df
2
MS
F
307.8 17.06839
P-value
F crit
0.00031 3.885294
12 18.03333
14
总计
832
14
有显著差异 LSD方法略 10.6
方差分析 差异源 组间 组内 总计
SS 5.349156 7.434306
12.78346
df
MS
F
P-value
F crit
2 2.674578 8.274518 0.001962 3.422132 23 0.323231
25
有显著差异
10.7 某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每个人使用其中的一种方法。通过对每个工人生产的产品数进行方差分析得到下面的结果;
方差分析表 df MS F P-value F crit 差异源 SS 420 2 210 1.47810219 0.245946 3.354131 组间 3836 27 142.0740741 组内 — — — 4256 29 总计 — — — — 要求: (1)完成上面的方差分析表。
(2)若显著性水平a=0.05,检验三种方法组装的产品数量之间是否有显著差异? 解:(2)P=0.025>a=0.05,没有显著差异。 10.8
方差分析 差异源 行 列 误差 总计
5.176 SS 1.549333
3.484 0.142667
df
2
14
MS
F
P-value
F crit 4.45897
4 0.387333 21.71963 0.000236 3.837853
1.742 97.68224 2.39E-06
8 0.017833
(1)有显著影响 (2)有显著影响
10.9 有5种不同品种的种子和4种不同的施肥方案,在20块同样面积的土地上,分别采用5种种子和4种施肥方案搭配进行试验,取得的收获量数据如下表: 品种 施肥方案 1 2 3 4 1 12.0 9.5 10.4 9.7 2 13.7 11.5 12.4 9.6 3 14.3 12.3 11.4 11.1 4 14.2 14.0 12.5 12.0 5 13.0 11.4 14.0 13.1 检验种子的不同品种对收获量的影响是否有显著差异?不同的施肥方案对收获量的影响是否有显著差异(a=0.05)?
方差分析 差异源 行
SS 19.067
df
4
MS F P-value F crit
4.76675 7.239716 0.003315 3.259167
15