50(3?16?22?9) ??1.986798525?25?12?38因为|U|?1.9867985?1.96,故在水平??0.05下拒绝H0,即两比例不相等.
U?
解法二:(本题是双边检验,采用四格表的卡方检验法) (1)建立四格表 合计 有自杀情绪 无自杀情绪 25 精神病患者 3 22 神经病患者 9 16 25 12 38 50 合计 (2)记p1?精神病患者有自杀情绪的比例,p2?神经病患者有自杀情绪的比例, 本题要检验两比例是否相等,即要检验假设
p1?p2 ?? H1:p1?p2, H0:n(n11n22?n12n21)2(3)取检验统计量??,拒绝域为{?2??12??(1)},
n1?n2?n?1n?22(4)对显著性水平??0.05,临界值?1??(1)??0.975(1)?3.84, (5)由题中数据算得检验统计量的值为
n(n11n22?n12n21)250(3?16?22?9)2????3.947368421?3.84
n1?n2?n?1n?225?25?12?38故在水平??0.05下拒绝H0,即两比例不相等.
222
解法三:(本题是双边检验,采用四格表的似然比检验法) (1)建立四格表 合计 有自杀情绪 无自杀情绪 25 精神病患者 3 22 神经病患者 9 16 25 12 38 50 合计 (2)记p1?精神病患者有自杀情绪的比例,p2?神经病患者有自杀情绪的比例, 本题要检验两比例是否相等,即要检验假设
p1?p2 ?? H1:p1?p2, H0:(3)取检验统计量G??2ln???2??nijln(2i?1j?122ni?n?jnnij2 ),拒绝域为{G2??12??(1)},
(4)对显著性水平??0.05,临界值?1??(1)??0.975(1)?3.84,
(5)由题中数据算得检验统计量的值为
22nn2G??2??nijln(i??j)?.........?4.091?3.84
nniji?1j?1故在水平??0.05下拒绝H0,即两比例不相等.
2注1:拒绝域要与假设配套,主要看备择假设!本题是双边检验,U检验的拒绝域也应是双边形式的,不能再象P68ex1那样用单边形式的拒绝域!具体场合下要能正确区分 “双边检验”与“单边检验”。
注2:考虑到本题中的样本量比较小,特别有的格子里的值为3(都小于5了!),故使用连续性修正似乎更好些。采用四格表的修正的卡方检验法(解法四),则
nn(|n11n22?n12n21|?)22,拒绝域为{?2??2(1)}, (3)取检验统计量?2?1??n1?n2?n?1n?2(4)对显著性水平??0.05,临界值?1??(1)??0.975(1)?3.84, (5)由题中数据算得检验统计量的值为
50(|3?16?22?9|?25)2???2.74122807?3.84
25?25?12?38故在水平??0.05下不能拒绝H0,即两比例相等.有意思的是,这时候得出了相
222反的结论!
注3:SPSS软件能很方便地计算四格表独立性双边检验的几种检验统计量和p值,下列为本题的SPSS卡方检验的程序输出。 卡方检验 Pearson 卡方 连续校正 似然比 Fisher 的精确检验 有效案例中的 N b值 3.947 2.741 4.091 adf 渐进 Sig. (双侧) 精确 Sig.(双侧) 精确 Sig.(单侧) 1 1 1 .047 .098 .043 .095 .048 50 a. 0 单元格(.0%) 的期望计数少于 5。最小期望计数为 6.00。 b. 仅对 2x2 表计算
(P71Ex12)本题是一个著名的心理学实验。
解:(本题不妨取单边检验,采用四格表的U检验法)分两方面进行分析:24种口味是否比6种口味更能吸引顾客试吃?24种口味是否比6种口味更能吸引顾客购买?另外,数据计算上注意到:
242?60%?145,242?60%?3%?4, 260?40%?104,260?40%?30%?31。
(一)24种口味是否比6种口味更能吸引顾客试吃? (1)建立四格表 顾客试吃 顾客未试吃 合计 145 97 242 24种口味 104 156 260 6种口味 249 253 502 合计 (2)记概率p1?P(顾客试吃|24种口味),p2?P(顾客试吃|6种口味),
现在要检验假设
p1?p2 ?? H1:p1?p2, H0:(3)取检验统计量U?n(n11n22?n12n21),拒绝域为{U?u1??},
n1?n2?n?1n?2(4)对显著性水平??0.05,临界值u1???u0.95?1.645, (5)由题中数据算得检验统计量的值为
U?n(n11n22?n12n21)502(145?156?97?104)??4.46?1.645
n1?n2?n?1n?2242?260?249?253故在水平??0.05下拒绝H0,即24种口味比6种口味更能吸引顾客试吃.
(二)24种口味是否比6种口味更能吸引顾客购买? (1)建立四格表 顾客购买 顾客未购买 合计 4 238 242 24种口味 31 229 260 6种口味 35 467 502 合计 (2)记概率p1?P(顾客购买|24种口味),p2?P(顾客购买|6种口味),
现在要检验假设
p1?p2 ?? H1:p1?p2, H0:(3)取检验统计量U?n(n11n22?n12n21),拒绝域为{U?u1??},
n1?n2?n?1n?2(4)对显著性水平??0.05,临界值u1???u0.95?1.645, (5)由题中数据算得检验统计量的值为
U?n(n11n22?n12n21)?n1?n2?n?1n?2502(4?229?238?31)??4.515?1.645
242?260?35?467故在水平??0.05下接受H0,即24种口味没能比6种口味更能吸引顾客购买.
(三)进一步考察24种口味是否比6种口味更能吸引顾客购买? 考虑改成要检验假设
p1?p2 ?? H1:p1?p2, H0:(3)取检验统计量U?n(n11n22?n12n21),拒绝域为{U??u1??},
n1?n2?n?1n?2(4)对显著性水平??0.05,临界值?u1????u0.95??1.645, (5)由题中数据算得检验统计量的值为
U?n(n11n22?n12n21)502(4?229?238?31)???4.515??1.645
n1?n2?n?1n?2242?260?35?467故在水平??0.05下拒绝H0,即24种口味吸引顾客购买的比例竟然显著低于6种口味吸引顾客购买的比例.这似乎有点奇怪,不过仔细想来,符合生活中的实际情况。
注1:关于本题的背景:果酱实验选择不是越多越好?
有选择比没选择好,选择多比选择少好,这几乎成了人们生活中的常识。但实际情况并非如此。
纽约哥伦比亚大学的研究人员希娜·延加开展自己的实验,研究发现,如果让消费者选择在6种还是24种果酱中挑选一种时,人们都愿意有更多的选择。可是真正决定购买的时候,在6种果酱中选择的人们作出的购买决定,是在24种果酱中选择的人作出购买决定的10倍。实验是在加州斯坦福大学附近的一个以食品种类繁多而闻名的超市中进行的。工作人员在超市里设置了两个试吃摊位,一个有6种口味的果酱,另一个有24种口味的果酱。结果显示有24种口味的摊位吸引的顾客较多:242位经过的客人中,60%会停下来试吃,而260个经过6种口味的摊位的客人中,停下来试吃的只有40%。不过最终的结果却出乎人们的意料:在有6种口味的摊位前停下的顾客中有30%的人都至少买了一瓶果酱,而在有24种口味的摊位前停下试吃者中只有3%的人购买了果酱。看来过多选项也不见得是一件好事,它会使人们陷入游移不定的状态。
注2:考察24种口味是否比6种口味更能吸引顾客购买时,有同学采用的假设检验如下:
记概率p1?P(顾客购买|试吃24种口味),p2?P(顾客购买|试吃6种口味), 现在要检验假设
H0:p1?p2??H1:p1?p2
(P69Ex5)
分析:记p1?左半球中有良性肿瘤的比例,
p2?右半球中有良性肿瘤的比例,
本题要检验假设
H0:p1?p2??H1:p1?p2
注意到四个格子中有三个格子的频数小于5,显然这是一个小样本的场合,所以题目要求采用Fisher精确检验法进行检验。 解:(Fisher精确检验法)
(1)记p1?左半球中有良性肿瘤的比例,p2本题要检验假设
?右半球中有良性肿瘤的比例,
H0:p1?p2??H1:p1?p2
(2)采用Fisher精确检验法,即取超几何分布HG(16,12,10)为检验分布,检验的p值为P(HG(16,12,10)?n11),
n1?,n?1}?min{12,10}?10, (3)题中n11?9,并注意到题中min{故检验的p值为
P(HG(16,12,10)?9)?P(HG(16,12,10)?9)?P(HG(16,12,10)?10) 12!4!1!3!12!4!1!3!???0.109890?0.008242?0.11813216!9!3!1!1!16!10!2!0!4!因为0.118132?0.05,故在水平??0.05下不能拒绝H0,即认为两比例相等.
注1:有同学未按照题目要求解题,题目要求采用Fisher精确检验法,但仍有同学采用单边的U检验法甚至采用双边的卡方检验。
注2:在计算出p值后,有不少同学给出的检验结论是错误的。P值是要和检验水平α比较的:当P值>α小时,不能拒绝原假设,即认为两比例相等. 注3:计算P(HG(N,M,n)=k),可调用Excel中的函数
HYPGEOMDIST(sample_s,number_sample,population_s,number_population) =HYPGEOMDIST(k;n,M,N)
注4:下表中有其他几种方法的检验结果,由于是小样本,可以看到,连续性校正的效果与精确检验一致。又问为何下表中精确检验的双侧p值与单侧p值差不多? 卡方检验 Pearson 卡方 连续校正 似然比 Fisher 的精确检验 有效案例中的 N b值 3.200 1.422 3.175 adf 渐进 Sig. (双侧) 精确 Sig.(双侧) 精确 Sig.(单侧) 1 1 1 .074 .233 .075 .118 .118 16 a. 3 单元格(75.0%) 的期望计数少于 5。最小期望计数为 1.50。 b. 仅对 2x2 表计算 (P69Ex7) 解法一:(Fisher精确检验法)
(1)将这个人随机猜测作为原假设H0,将有品酒能力作为备择假设。即
|实际为黄酒),p1?P(猜测为黄酒|实际为白酒), 记p1?P(猜测为黄酒本题要检验假设
H0:p1?p2??H1:p1?p2