习题答案网http://www.jiexi360.cn
第十三章 双变量关联性分析
【思考与习题】
一、思考题
1.两变量间的关联性是否可解释为因果关系?
2.2?2列联表的关联性分析与两样本率比较的?2检验有何不同?
3.相关系数r经假设检验有统计学意义,且得到的P值很小,是否表示两变量间一定有很强的直线关系?
4.简述Pearson积矩相关与Spearman秩相关的区别与联系。
二、案例辨析题
为研究年龄与牙齿AKP酶反应活性之间的关系,某医生在其接诊的患者中随机抽取281例,按年龄(岁)分为三组进行观测,测量各患者牙齿的AKP酶反应活性,如表13-1所示。问年龄与牙齿AKP酶反应活性之间有无关系?
表13-1 281例患者年龄与牙齿AKP酶反应活性的分布 年龄
—
AKP酶反应活性
+ 17 34 97 148
++ 36 54 12 102
合计 58 90 133 281
<31 31~ 51~ 合计
5 2 24 31
按照R×C表的?2检验结果,得?2=84.533,P?0.005,故按?=0.05水准,拒绝H0,可认为不同年龄患者的AKP酶反应活性不同,两者之间有关系。以上分析正确吗?
三、最佳选择题
1.Pearson积矩相关系数的假设检验,其自由度为 A.n?1 B.n?2 C.2n?1
13-1
习题答案网http://www.jiexi360.cn
D.2(n?1) E.n
2.积矩相关系数的计算公式是 A.r?B.r?lxylxylyylxxlxxlyylxylxxlyylyylxxlyylxylxxlyy
C.r?
D.r?
E.r?
3. 直线相关分析中,若|r|?r0.05,?,则可认为两变量之间 A. 有一定关系 B. 不存在直线相关关系 C. 有直线相关关系
D. 有直线相关关系,且为正相关 E. 有直线相关关系,且为负相关 4.下列指标中可正可负的是 A.F统计量 B.?2统计量
nC.lxx?D.lxy?E.lyy??(x?x)
2i?1n?(x?x)(y?i?1ny)
?(y?i?1y)2
5.研究18岁女大学生体重和肺活量的关系时,表达正确的无效假设是 A.体重与肺活量无关联
13-2
习题答案网http://www.jiexi360.cn
B.体重与肺活量有关联 C.体重与肺活量有直线关系 D.体重与肺活量有因果关系 E.体重与肺活量无因果关系 6.计算Pearson列联系数的公式为 A.r?lxylxxlyy B.r???22?n
C.r???n??222
D.r?E.r?n?1
?22??n7.某放射科医师收集脑外伤患者30例,观察脑出血直径和病人昏迷的程度(轻度、中度、重度),欲分析昏迷程度是否与病灶大小有关,可进行 A.Pearson相关分析 B.Spearman秩相关分析 C.两小样本比较的t检验 D.方差分析 E.?2检验
8.对两个分类变量的频数表资料作关联性分析,可用 A.积矩相关或等级相关 B.积矩相关或列联系数 C.列联系数或等级相关 D.积矩相关 E.等级相关
9.两组数据分别进行直线相关分析,对r1进行假设检验得到P<0.05,对r2进行假设检验,得到P<0.001,可以认为
13-3
习题答案网http://www.jiexi360.cn
A.第一组的两个变量关系比第二组密切 B.第二组的两个变量关系比第一组密切
C.更有理由认为第一组的两个变量之间有直线关系 D.更有理由认为第二组的两个变量之间有直线关系 E.两组变量关系同样密切
四、综合分析题
1.为研究某病成年男性患者血浆清蛋白含量与血红蛋白含量的关系,某医生测得10名患者血浆清蛋白含量(g/L)及血红蛋白含量(g/L)见表13-2所示,试分析二者是否有关联。
表13-2 10名某病成年男性患者的血浆清蛋白含量( x )及血红蛋白含量( y )
编号 1 2 3 4 5 6 7 8 9 10
血浆清蛋白含量(g/L)
36 37 39 38 36 35 34 34 35 34
血红蛋白含量(g/L)
119 121 128 127 121 119 111 109 109 105
2.某医院用两种方法对已确诊的50名乳腺癌患者进行检查,结果如表13-3所示。两种检查方法是否有关联?
表13-3 50名乳腺癌患者的两种检查结果
甲法
乙法 阳性 阴性 合计
阳性 18 8 26
阴性 9 15 24
合计 27 23 50
13-4
习题答案网http://www.jiexi360.cn
3.为探讨流行性出血热的早期分度和最后定型之间的关系,某研究对404例该病患者的病情资料进行分析,如表13-4所示。据此回答:是否早期分度越高,最后定型越重?
表13-4 404例流行性出血热患者的病情转化情况
最后定型
早期分度
轻型
轻度 中度 重度 合计
98 5 1 104
中型 20 136 2 158
重型 1 21 120 142
119 162 123 404 合计
【习题解析】
一、思考题
1.双变量关联性分析的目的在于推断从某一总体中随机抽取的同一份样本观测出的两个变量间是否存在关联性,以及这种关联性的密切程度如何。关联性只反映变量间数量上的关系,但数量上的关联并不表示专业上的因果关系,是否确为因果关系还需结合专业知识、因果逻辑上的时间先后顺序等作进一步判定。 2.2?2列联表的关联性分析与两样本率比较的?2检验的数据形式非常相似,?2检验的公式以及应用条件也完全相同。但区别在于:两样本率比较的?2检验是从两个总体中分别抽取样本,两样本有各自的频数分布,所检验的是两总体的率是否相同;而2?2列联表的关联性分析是从同一个总体中进行随机抽样,对样本中的每个个体考察其两个变量的关系,检验两个分类变量之间是否存在关联性或者说是否独立。
3.P值越小,说明越有理由拒绝H0,犯I型错误的概率越小。相关系数r经假设检验有统计学意义且得到非常小的P值,表示有足够的理由认为两变量总体相关系数??0,只能定性回答两变量是否存在直线相关,并非意味着其直线相关的强度。若要定量回答相关性的强弱,需结合样本相关系数r的大小和总体相关系数?的置信区间来说明。
4.区别:①Pearson积矩相关适用于二元正态分布资料,Spearman秩相关适用于
13-5