(3)取检验统计量U?n(n11n22?n12n21),拒绝域为{U?u1??},
n1?n2?n?1n?2(4)对显著性水平??0.05,临界值u1???u0.95?1.645, (5)由题中数据算得检验统计量的值为
U?n(n11n22?n12n21)715(20?316?373?6)??2.29?1.645
n1?n2?n?1n?226?689?393?322故在水平??0.05下拒绝H0,即护理少会引起婴儿死亡多.
(二)将三维列联表分层为两个四格表的分析 (1)分层后得
“护理×婴儿生存情况”(A医院)四格表 死亡 存活 合计 较少 3 176 179 较多 4 293 297 合计 7 469 476 “护理×婴儿生存情况”(B医院)四格表 死亡 存活 合计 较少 17 197 214 较多 2 23 25 合计 19 220 239
(2)要分别检验假设:(对于A医院)
H0:护理多少与婴儿死亡无关??H1:护理少会引起婴儿死亡多。 (对于B医院) H0:护理多少与婴儿死亡无关??H1:护理少会引起婴儿死亡多。 (3)取检验统计量U?n(n11n22?n12n21),拒绝域为{U?u1??},
n1?n2?n?1n?2(4)对显著性水平??0.05,临界值u1???u0.95?1.645, (5)由题中数据分别算得检验统计量的值为
476(3?293?176?4)?0.289?1.645
7?469?179?297239(17?23?197?2)UB???0.01?1.645
19?220?214?25故在水平??0.05下都不能拒绝H0, UA?即对于A医院和B医院,护理多少与婴儿死亡无关.
(三)上述压缩和分层两方面的分析结果不一致,由于压缩会受到混杂因素的干扰,分层分析的结论是可靠的,所以认为护理多少与婴儿死亡无显著关系。
注:本题类似例5.2,和“Simpson悖论”的例子相似。医院是混杂因素,两医院中的护理多与护理少的婴儿比例差异很大。
“护理×婴儿生存情况”(A医院)条件分布列
死亡 存活 0.01676 0.98324 较少 死亡 存活 0.013468 0.986532 较多 “护理×婴儿生存情况”(B医院)条件分布列
死亡 存活 0.079439 0.920561 较少 死亡 存活 0.08 0.92 较多 B医院的死亡率高于A医院,两个死亡率的差异主要是医院因素造成的。 压缩后的四格表中
20179321417179214317p1??????(,)(?,)'
393393197393214393393197214629742522972542p2??????(,)(?,)'
322322297322253223222972531742(,)?(0.0168,0.0578)?(0.0135,0.08)?(,)其中, 1972142972517921429725(,)?(0.4555,0.5445)?(0.9224,0.0776)?(,) 但
393393322322
(P160Ex3)
分析:先将属性B和C合并成一个属性变量,再采用二维列联表的卡方检验或似然比检验(见教材129-130页)。 解:(1)合并数据得
城市* 文化程度和看法 交叉表 1(小学不同意) 2(小学不表态) 3(小学同意) 4(初中不同意) 文化程度和看法 5(初中不表态) 6(初中同意) 7(高中不同意) 8(高中不表态) 9(高中同意) 10(大学不同意) 11(大学不表态) 城市 1 23 7 2 10 23 5 5 20 13 6 10 2 18 6 1 6 18 2 2 13 13 2 9 3 8 6 3 12 4 4 2 11 6 4 7 4 12 9 1 2 15 3 3 8 14 6 4 12(大学同意) 24 15 7 13
(2)要检验假设 H0:城市间文化程度与看法没有差别 ??H1:城市间文化程度与看法有差别。
即要检验假设
属性A与(B,C)独立 ?? H1:属性A与(B,C)不独立。 H0:ni??n?jk2)rct(nijk?2n?????(3)取检验统计量, ni??n?jki?1j?1k?1n拒绝域为{?2??12)(ct?1))}, ??((r?122(4)显著性水平??0.05,临界值?12??((r?1)(ct?1))??0.95 (3?11)??0.95(33)?47.4,(5)由题中数据算得检验统计量的值为
ni??n?jk2)443(nijk?2n??????36.947?47.4
nni???jki?1j?1k?1n故在水平??0.05下不能拒绝H0,即认为城市间文化程度与看法没有差别.
(P160Ex4)
分析:参考教材例5.3的解法,建立表格,汇总各独立性检验的结果。
解:
用A表示年龄,B表示治疗效果,C表示治疗方法,独立性检验结果如下:
?2 自由度 临界值 P值 原假设 G2 (A,B,C) 36.457 38.372 (A,BC) 34.291 35.575 (B,AC) 36.457 38.372 (C, AB) 3.808 3.782 (AB,AC) 3.808 3.781 (BA,BC) 1.643 1.646 (CA, CB) 34.291 35.575 7 5 6 5 4 3 4 14.067 0.000 11.07 0.000 12.592 0.000 11.07 0.577 9.488 0.433 7.815 0.650 9.488 0.000 综上,治疗方法与(年龄,治疗效果)相互独立,即治疗方法之间没有显著差异。年龄与治疗效果之间不独立,有显著关系。接下来可以合并数据分析年龄与治疗效果之间的关系。
注:相互独立意味着数据合起来看与分开来是一致的,因此合并各层数据,同一层的两个变量间的关系可以看得更为清楚稳定。
(P160Ex6)(分开看与合起来看)
分析:综合分层分析与压缩合并数据分析,得出合理的结论。 解:
记条件概率p1?P(偏好饮料A|男性),p2?P(偏好饮料B|女性), (一)将三维列联表压缩成四格表的分析 (1)压缩后得四格表 偏好饮料A 偏好饮料B 合计 67 69 136 男性 42 34 76 女性 109 103 212 合计 (2)要检验假设 H0:性别与饮料偏好没有关系??H1:性别与饮料偏好有关系。
即要检验假设
p1H0:2?p2 ??
p1H1:?p2,(双侧检验)
n(n11n22?n12n21)22(3)取检验统计量??,拒绝域为{?2??1(1)}, ??n1?n2?n?1n?2(1)??0.95(1)?3.84, (4)对显著性水平??0.05,临界值?1??(5)由题中数据算得检验统计量的值为
n(n11n22?n12n21)2?????0.702?3.84
n1?n2?n?1n?2222故在水平??0.05下不能拒绝H0,即性别与饮料偏好没有关系.
(二)将三维列联表按照年龄变量分层,分别对两个四格表分析 分层后得
“性别×饮料偏好”(年轻人)四格表 偏好饮料A 偏好饮料B 合计 37 26 63 男性 11 23 34 女性 48 49 97 合计 “性别×饮料偏好”(老年人)四格表 偏好饮料A 偏好饮料B 合计 30 43 73 男性 31 11 42 女性 61 54 115 合计
对于年轻人,检验性别与饮料偏好是否有关系: (1)H0:性别与饮料偏好没有关系??H1:性别与饮料偏好有关系。
即要检验假设
p1H0:2?p2 ??
H1:p1?p2,(双侧检验)
n1??(n111n122?n112n121)22(2)取检验统计量??,拒绝域为{?2??1(1)}, ??n11?n12?n1?1n1?2(1)??0.95(1)?3.84, (3)对显著性水平??0.05,临界值?1??(4)由题中数据算得检验统计量的值为
n1??(n111n122?n112n121)2?????6.146?3.84
n11?n12?n1?1n1?2222故在水平??0.05下拒绝H0,
即对于年轻人,性别与饮料偏好是有关系的. 对于老年人,检验性别与饮料偏好是否有关系: (1)H0:性别与饮料偏好没有关系??H1:性别与饮料偏好有关系。
即要检验假设
p1H0:2?p2 ??
H1:p1?p2,(双侧检验)
n2??(n211n222?n212n221)22(2)取检验统计量??,拒绝域为{?2??1(1)}, ??n21?n22?n2?1n2?2(1)??0.95(1)?3.84, (3)对显著性水平??0.05,临界值?1??(4)由题中数据算得检验统计量的值为
n2??(n211n222?n212n221)2?????11.455?3.84
n21?n22?n2?1n2?2222故在水平??0.05下拒绝H0,
即对于老年人,性别与饮料偏好是有关系的.
(三)上述压缩和分层两方面的分析结果是不一致的,应该采信分层的结论。以下分层进行相合性检验。
对于年轻人,计算?相合系数,并检验性别与饮料偏好是否有相合关系。 (1)要检验假设:
H0:性别与饮料偏好不相合??H1:性别与饮料偏有相合关系。
?(2)采用检验统计量U?,拒绝域为{|U|?u1??/2}。
?b(?)(3)取??0.05,拒绝域为{|U|?u0.975?1.96}
(4)根据SPSS软件的计算输出可知,检验统计量的值为
0.252U???2.566?1.96,
?b(?)?b(?)故在水平??0.05下拒绝H0,即对于年轻人,性别与饮料偏好有相合关系。
对于老年人,计算?相合系数,并检验性别与饮料偏好是否有相合关系。 (1)要检验假设:
H0:性别与饮料偏好不相合??H1:性别与饮料偏有相合关系。 (2)采用检验统计量U???,拒绝域为{|U|?u1??/2}。 ?b(?)(3)取??0.05,拒绝域为{|U|?u0.975?1.96}
(4)根据SPSS软件的计算输出可知,检验统计量的值为