一、 简答题(每题6分,共60分)
1、 配对比较的假设检验,符合参数检验条件,能否出现t检验结果P>0.05;而非参数检验P<0.05的结果?如果出现上述情况,此时应该怎样解释检验结果?
应该以资料满足的条件为准。若资料满足参数检验的条件应以参数检验的结果为准,此时非参数的检验效能低于参数检验。若资料不服从正态分布,或者分布情况未知,不能用参数法进行推断,一采用非参数发对总体分布位置进行假设检验。
2、某市为了解该地居民发汞(μmol/kg)的基础水平,为汞污染的坏境监测积累资料,对238名留住该市一年以上,无汞作业接触史,无明显肝、肾疾病的居民进行了调查,结果见表1:
表1:238名居民发汞含量(μmol/kg)
1.5
发汞含量 人 数
~ 20
3.5~ 66
5.5~ 60
7.5~ 48
9.5~ 18
11.5~ 16
13.5~ 6
15.5~ 1
17.5~ 0
19.5~21.
5 3
(1) 说明此频数分布的特征;选用何中指标描述其集中趋势和离散趋势较好? 正偏态分布,集中趋势用中位数表示,离散趋势用四分位数间距表示 (2) 计算该地居民发汞值的95%正常值范围(只写公式,不必计算)。 P2.5-P97.5 下限:1.5+2/20(238*2.5%-0) 上限:13.5+2/6(238*97.5%-228) 3、标淮差与标准误之间的联系与区别是什么?
1标准差表示变量间的离散程度;标准误是样本均数的标准差,表示均数的抽样误差。2标准差的计算公式,标准误的计算公式。3标准差越小表示个体值越集中,均数对数据的代表性越好;标准误越小表示样本均数越集中,样本均数与总体均数的差别越小,由样本均数估计总体均数的可靠性越大。 当样本量一定时,标准误随标准差的增大而增大
表2:某年某医院住院病人按职业分组情况 职业 工人 农民 其他 合计
患病人数 750 100 150 1000
百分比(%)
75 10 15 100
4、某医师对某年某医院的住院病人按不同
职业进行分组统计,结果见表2。该医
师得到结论:全体病人中工人占75%,
农民占10%。因此,工人比农民更容易 患病,提示工人的健康状况应受到重视。 你认为这种说法是否合理?若不合理, 为什么?
不合理,犯了以构成比代替率的错误。该表格显示的是不同职业患病人数占总人数的比重,是构成比,并不能表示频率或者强度。而是否容易患病是发病率的比较。
4、某年级一班、二班各有学生50人。从两个班级各抽取10人测量身高,并求其平均身高。如果一班平均身高160cm,二班平均身高154cm,能否认为一班学生的平均身高高于二班?为什么?
不能,根据样本均数推断总体均数的时候,由于存在抽样误差,两总体均数的比较需要进行假设检验,判断差异是由抽样误差引起的,还是两者总体均数存在本质不同。
5、某研究探讨身高与体重的关系,得到r=0.89,同时算得b=-1.35,该分析结果是否正确?为什么?
不正确。对于双变量服从正态分布的一组数据既可以进行直线相分析关也可以进行直接回归分析,计算出的b和r应该是正负号一致的。
6、什么是检验效能?其主要影响因素是什么?检验效能是当两个总体确实有差别时,即H1成立,使用假设检验可以发现这种差别的能力,用1-β表示。当样本量一定时,α越大β越小,两者成反比;当样本量增大时α,β都变小。 7、为了比较 3种不间疗法的对白血病患者最初缀解期之间疗效是否有差别,一些白血病患者被随机地分入甲、乙、丙3种不同疗法组中接受治疗。研究者
采取了t检验进行两两比较,这种分析方法是否正确?若不正确,说明理由。 不正确,疗效根据患者的病情轻重会有很大的不同,应该根据患者病情轻重,疾病类型等分成不同的区组,再进一步比较疗效不同,以避免非处理因素对实验结果的影响。(1.患者病情轻重不一样2.两两分别进行t检验会增大犯I型错误的概率,应该先进行多个样本均数的方差分析,有统计学差异时再进行两两比较的SNK或Dunnett法)
9、实验设计的基本要素和基本原则分别是什么? 受试对象,处理因素,实验效应指标。 随机 对照 可重复。
10、某地区某疾病连续3年患病率分别为6.0%、9.0%、12.0%,则该病3年总的患病率为:(6.0+9.0+12.0)/3=9.0%。此算法是否正确?为什么?不正确,计算患病率应该分子分母同时相加,计算合计率,而不能直接相加再平均。 二、
分析题(34分)
1、随机将20只雌体中年大鼠均分为甲、乙两组,甲组不接受任何处理,乙组中的每只大鼠接受3mg/kg的内毒素,分别测将两组大鼠的肌酐(mg/L)如下: 甲 组:6.2 3.7 5.8 2.7 3.9 6.1 6.7 7.8 3.8 6.9 乙 组:8.5 6.8 11.3 9.4 9.3 7.3 5.6 7.9 7.2 8.2
(1) 该资料属于何种类型?定量资料 该研究设计属于何种类型?完全随机设计
(2) 试检验两总体均值之间有无差别?请写出统计分析的基本步骤,不必计算。服从正态分布,使用两独立样本t检验
2、某人欲比较两种检验方法对血样中某抗体的检出率,将150份血佯同时用两种方法进行检测,结果分为阳性和阴性。已知甲组的阳性检出率为60%,乙组阳性检出率为50%,两种方法共同检出45例。 (1) 将资料整理成合理的表格形式。
(2) 该资料属于何种类型?分类资料 该研究设计属于何种类型?配对设计 (3) 试比较两种方法的检出率有无差异?(χb+c>40,不需要矫正 乙组
甲组
-
合计
2
0.05,1=3.84
)
+
+ - 合计
3、下表资料是某药治疗两种不同病情的老年慢性支气管炎病人的疗效, 表3:某药对两种病情的老年慢性支气管炎的
疗效
合
疗效 控制 显效 有效 无效 合计
单纯型 65 18 30 13 126
单纯型合并肺气肿
42 6 23 11 82
计 107 24 53 24 208
秩次范围 1-107 108-131 132-184 185-208
平均秩次
秩和
45 90
30 60
75 150
45
30
75
(1) 该资料属于何种类型?该研究设计属于何种类型?分类资料,成组设计 (2) 该药对两种病情的疗效是否不同?请写出统计分析的基本步骤,不必计算。秩和检验
从小到大统一编秩,计算平均秩次和秩和。取62例的秩和作为T,可能超出表的范围,需要正态近似法,Z检验,相持较多需要矫正,查t界值表 三、
SPSS结果分析题(6分)
研究成年男子(尸检)肾脏重量与心脏重量之间的是否有数量依存关系,收集到其10个相关的数据见表4:
表4:10名成人男子肾重与心重数据 病人编号
1 2 3
肾重X(g) 333 357 361
心重Y(g) 271 439 328
4 5 6 7 8 9 10
Tests of Normality
Kolmogorov-Smirnov(a) 肾重 心重 Statistic .169 .170 df 10 10 Sig. .200(*) .200(*) 305 269 340 369 312 268 354
326 276 305 404 262 255 350
Shapiro-Wilk Statistic .892 .906 df 10 10 Sig. .180 .258 * This is a lower bound of the true significance. a Lilliefors Significance Correction
Model 1 RegressiSum of Squares 17843.3df Mean Square 1 17843.340 F 8.652 Sig. .019(a) ANOVA(b)
on Residual 40 16499.060 8 2062.383 Total 34342.400 9 a Predictors: (Constant), 肾重 b Dependent Variable: 心重
CoefficientsaUnstandardizedCoefficientsBStd. Error-71.890134.5451.204.409StandardizedCoefficientsBeta.72195% Confidence Interval for BLower BoundUpper Bound-382.151238.372.2602.148Model1(Constant)肾重t-.5342.941Sig..608.019a. Dependent Variable: 心重 (1) 资料是否符合直线回归分析的条件?1.散点图2.双变量正态性
(2) 成年男子(尸检)肾脏重量与心脏重量之间关系是否有统计学意义?若有写出回归方程,并对回归系数作假设检验。