Chi-Square TestsValue4.525b3.4654.6554.47184df1111Asymp. Sig.(2-sided).033.063.031.034Exact Sig.(2-sided)Exact Sig.(1-sided)Pearson Chi-SquareaContinuity CorrectionLikelihood RatioFisher's Exact TestLinear-by-LinearAssociationN of Valid Cases.061.030a. Computed only for a 2x2 tableb. 0 cells (.0%) have expected count less than 5. The minimum expected count is 9.00. 2. 解:
(1) 资料整理后的表格为
表11-6 两种CT对煤工尘肺肺气肿的检查结果
HRCT
合计
有 无
75 73 2
7 14 21 80 16 96
螺旋CT 有
无 合计
(2) 该研究属于配对设计,所得数据为分类资料。
(3) 该资料为分类资料,欲比较螺旋CT和HRCT在煤工尘肺肺气肿检出方面有无差异,宜选用配对四格表的?2检验。
具体步骤为:
1) 建立检验假设,确定检验水准
H0:B?C,即两种CT检出煤工尘肺肺气肿的结果无差异 H1:B?C,即两种CT检出煤工尘肺肺气肿的结果有差异 ??0.05
2) 计算检验统计量
本题b?c?9?40,应采用配对四格表?2检验的校正公式:
22(b?c?1)(2?7?1)?2???1.778
(b?c)(2?7) ??1
3) 确定P值,作出统计推断
查?2界值表(附表9),得P?0.05,按??0.05水准,不拒绝H0,差异无统计学意义,尚不能认为两种CT煤工尘肺肺气肿的检出率有差异。 输出结果
4-21
螺旋CT检查结果 * 高分辨率CT检查结果 CrosstabulationCount高分辨率CT检查结果肺气肿无肺气肿螺旋CT检查结果Total肺气肿无肺气肿7378021416Total752196McNemar TestN of Valid CasesChi-Square TestsValue96Exact Sig.(2-sided).180aa. Binomial distribution used. 3. 解:本题资料为分类资料,欲比较3种方案治疗单纯性肥胖的有效率有无差异,宜选用独立样本R?C列联表的?2检验。具体步骤为:
1) 建立检验假设,确定检验水准
H0:?1??2??3,即3种方案治疗单纯性肥胖的有效率相同 H1:3种方案治疗单纯性肥胖的有效率不全相同 ??0.05
2) 计算检验统计量
最小理论频数T?9.33,故直接将数据带入独立样本R?C列联表?2检验的公式:
A22??n(??1)nRnC35252272132302102?120?(??????1)
40?9240?2840?9240?2840?9240?28?4.565(??1)?(3?1)(?2 1 ??(R?1)C3) 确定P值,作出统计推断
查?2界值表(附表9),得0.10?P?0.25,按??0.05水准,不拒绝H0,差异无统计学意义,尚不能认为3种方案治疗单纯性肥胖的有效率不同。 输出结果 方案 * 疗效 Crosstabulation疗效有效方案甲方案乙方案丙方案TotalCount% within 方案Count% within 方案Count% within 方案Count% within 方案3587.5'67.5075.0?76.7%无效512.532.525.0(23.3%Total40100.0@100.0@100.00100.0% 4-22
Chi-Square TestsValue4.565a4.8111.732120df221Asymp. Sig.(2-sided).102.090.188Pearson Chi-SquareLikelihood RatioLinear-by-LinearAssociationN of Valid Casesa. 0 cells (.0%) have expected count less than 5. Theminimum expected count is 9.33. 4. 解:
(1) 该资料为分类资料,欲比较两药治疗胃溃疡的疗效构成比有无差异,宜选用独立样本R?C列联表的?2检验。先将资料整理成下表形式:
组别 试验组 对照组 合计
表11-7 两种药物治疗治疗胃溃疡的疗效 痊愈 显效 进步 无效 20(58.82) 6(17.65) 4(11.76) 4(11.76) 16(47.06) 4(11.76) 8(23.53) 6(17.65) 36 10 12 10
合计
34(100) 34(100) 68
假设检验的具体步骤为:
1) 建立检验假设,确定检验水准
H0:两药治疗胃溃疡的疗效构成比相同 H1:两药治疗胃溃疡的疗效构成比不同 ??0.05
2) 计算检验统计量
最小理论频数T?5,故直接将数据带入独立样本R?C列联表?2检验的公式:
A22??n(??1)nRnC202624242162428262?68?(????????1)34?3634?1034?1234?1034?3634?1034?1234?10?2.578??(R?1)C(?1?)?(2?1)(?4 13) 确定P值,作出统计推断
查?2界值表(附表9),得0.25?P?0.50,按??0.05水准,不拒绝H0,差异无统计学意义,尚不能认为两药治疗胃溃疡的疗效构成比不同。
(2) 若比较两药有效率有无差异,宜选用独立样本四格表的?2检验。按题意将资料整理成下表形式:
组别 试验组 对照组 合计
表11-8 两种药物治疗治疗胃溃疡的疗效
有效 无效 26 8 20 14 46 22
合计
34 34 68
(3) 若比较两药治疗胃溃疡的疗效大小,宜选用秩和检验。因为本题中治疗效果呈等级变化,
4-23
由于?2检验未考虑“疗效”的等级顺序,因此经?2检验只能说明各处理效应的构成比是否有差别。而秩和检验考虑了“疗效”的等级顺序,用于比较疗效大小比?2检验更合理。 输出结果 分组 * 治疗效果 Crosstabulation治疗效果显效进步6417.6.8H11.8#.51214.7.6%分组试验组对照组TotalCount% within 分组Count% within 分组Count% within 分组痊愈2058.847.1652.9%无效411.8a7.614.7%Total34100.04100.0h100.0% Chi-Square TestsValue2.578a2.6101.61768df331Asymp. Sig.(2-sided).461.456.204Pearson Chi-SquareLikelihood RatioLinear-by-LinearAssociationN of Valid Casesa. 0 cells (.0%) have expected count less than 5. Theminimum expected count is 5.00. 以上是问题(1)的SPSS分析过程。问题(2)的SPSS分析过程请参见本章综合分析题的第1题,问题(3)的SPSS分析过程请参见第十二章相关内容。
第十三章 双变量关联性分析
【习题解析】
一、思考题
1.双变量关联性分析的目的在于推断从某一总体中随机抽取的同一份样本观测出的两个变量间是否存在关联性,以及这种关联性的密切程度如何。关联性只反映变量间数量上的关系,但数量上的关联并不表示专业上的因果关系,是否确为因果关系还需结合专业知识、因果逻辑上的时间先后顺序等作进一步判定。
2.2?2列联表的关联性分析与两样本率比较的?2检验的数据形式非常相似,?2检验的公式以及应用条件也完全相同。但区别在于:两样本率比较的?2检验是从两个总体中分别抽取样本,两样本有各自的频数分布,所检验的是两总体的率是否相同;而2?2列联表的关联性分析是从同一个总体中进行随机抽样,对样本中的每个个体考察其两个变量的关系,检验两个分类变量之间是否存在关联性或者说是否独立。
3.P值越小,说明越有理由拒绝H0,犯I型错误的概率越小。相关系数r经假设检验有统计学意义且得到非常小的P值,表示有足够的理由认为两变量总体相关系数??0,只能定性回答两变量是否存在直线相关,并非意味着其直线相关的强度。若要定量回答相关性的强弱,需结合样本相关系数r的大小和总体相关系数?的置信区间来说明。
4.区别:①Pearson积矩相关适用于二元正态分布资料,Spearman秩相关适用于不服从正态分布、总体分布未知、存在极端值或原始数据用等级表示的资料。②Pearson积矩相关是基于原始数据进行统计分析,而Spearman秩相关是将原始数据进行秩变换后进行统计分析。③Pearson积矩相关是参数检验方法,而Spearman秩相关不以特定的总体分布为前提,为非参数检验的方法。联系:①两种相关系数的取值都介于-1和1之间,无单位,小于 0 为负相关,大于0为正相关。②用原始数据的秩次来计算Pearson相关系数,得到的即为Spearman秩相关系数。
4-24
二、案例辨析题
该案例是对同一样本的两个分类变量之间的关联性进行分析,?2检验的计算方式不变,结果仍为84.533,但下结论时最好不要从“不同年龄的AKP酶反应活性不同”演绎到“两变量有关系”,而应为“按?=0.05水准,拒绝H0,可认为年龄与AKP酶反应活性之间有关”。此外,可结合列
84.533?0.481。 2??n84.533?281由于年龄与AKP酶反应活性都是有序分类变量,可考虑进行Spearman秩相关分析,得rs??0.487,单侧P?0.001,可认为随着年龄的增加,AKP酶反应活也降低。
三、最佳选择题
1. B 2. C 3. C 4.D 5.A 6.B 7.B 8.C 9. D
四、综合分析题 1.解:
(1) 由散点图(略)结合两个变量的正态性检验,可进行直线相关分析。 由式(13.1)分别算出
lxx??x2?(?x)2/n?27.6 联系数说明其关联强度,r??2?lyy??y2?(?y)2/n?568.9
lxy??xy?(?x?y)/n?114.8
r?lxylxylyy?0.916
但需进行假设检验以推断总体上这种相关是否存在。 (2) 检验相关是否具有统计学意义 1) 建立检验假设,确定检验水准
H0:??0,即血浆清蛋白含量及血红蛋白含量之间无直线相关关系
H1:??0,即血浆清蛋白含量及血红蛋白含量之间有直线相关关系 ??0.05
2) 计算检验统计量 由式(13.4)和式(13.5)得
r0.916tr???6.458
221?r1?0.916n?210?2??n?2?8
3) 确定P值,作出统计推断
查t界值表(附表3),得P?0.001,按?=0.05水准,拒绝H0,接受H1,可以认为该病成年男
性患者血浆清蛋白含量与血红蛋白含量呈正相关关系。 输出结果
4-25