模拟试卷
课程名称 :医学统计学
一、 名词解释
1. Population and Sample
总体:根据调查目的确定的同质研究对象的集合。分为无限总体和有限总体。 样本:从总体中抽取的部分研究对象。 2. Sampling error
抽样误差:由个体变异、随机抽样引起的统计量与总体均数之间的差异。 3. Cross-over design 交叉设计: 每个受试者随机地在两个或多个不同试验阶段分别接受指定的处理(试验药或对照药)。
4. Confidence interval
可信区间:按预先给定的概率(1-a), 确定一个包含未知总体参数的范围。这一范围称为参数的可信区间或置信区间(confidence interval,CI) 5. Coefficient of variation
变异系数:常用于比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异程度,公
S式为 CV?X?100%二、 填空题
1. 可信区间是指按预先给定的概率(1-a), 确定一个包含未知总体参数的范围。这一范围称为参数的可信区间或置信区间(confidence interval,CI)
2. 常用的相对数有_________________、___________________、__________________ 3. 假设检验的Ⅰ型错误是指拒绝正确的无效假设,用a表示,又称为检验水准 4. 统计工作的基本步骤研究设计、资料收集、统计分析、结果表达 5. 对于四格表资料,当n≥40但有1≤T<5时,应该选用校正卡方和确切概率方法分析
三、选择题
1. 测量身高、体重、转氨酶等指标所得的资料叫做:B
(A)计数资料 (B)计量资料 (C)等级分组资料(D)间断性资料 2. 流行性乙型脑炎发病率的高低与年龄有关,据调查,3~8岁的儿童较其他年龄的人易患此病,为了反映患者年龄的频数分布规律,应选用:B
(A)条图 (B)直方图 (C)圆图 (D)线图
3. 设某一医学指标的观测值过小或过大都无实际意义,需要详细记录的是介于二者之间的数据,有一化验员记录了某病患者10人该指标的化验结果为:6.2,<2.0的有4个数,8.3,>10.0的有3个数,7.5。请选择合适的平均指标反映该组数据的平均水平:C
(A)算术平均数 (B)几何平均数 (C)中位数 (D)调和平均数 4. 测量某医学指标,得到500个性质相同且近似服从正态分布的实验数据可求得算术平均数(x),标准差(s)和标准误(sx)。区间[x-1.960s,x+1.960s]所代表的含义为:C
(A)它是x的95%可信区间 (B)它是总体均数(μ)的5%可信区间
(C)它是该医学指标的95%正常值范围
(D)它是该医学指标的99%正常值范围
5. x、s和sx同上题,区间[x-2.576sx,x+2.576sx]所代表的含义为:A
(A)它是总体均数μ的99%可信区间 (B)它是x的99%可信区间
(C)它是95%的正常值范围 (D)它是总体率π的95%可信区间
6. 良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:A (A)系统误差 (B)随机误差 (C)抽样误差 (D)责任事故 7. 假设一组正常人的胆固醇值和血磷值均近似服从正态分布。为从不同角度来分析该两项指标间的关系,可选用:B
(A)配对t检验和标准差 (B)变异系数和相关回归分析 (C)成组t检验和F检验 (D)变异系数和Z检验
8. 四个样本均数经方差分析后P<0.05,为进一步弄清四个均数彼此之间的相差程度,须进行:D
(A)χ2检验 (B)t检验 (C)Z检验 (D)q检验 9. 为了使显著性检验的两类错误同时减少,可采取措施:B
(A)提高显著性水平 (B)增加样本含量 (C)降低实验误差(D)增加人员和设备 10. 研究变量x和y之间的关系时,算得相关系数r=0,据此可以认为两者之间:B (A)无关 (B)呈零相关 (C)无直线关系 (D)呈曲线关系
四、问答题:
1. 经大量调查得知,某市正常3岁女童的体重近似服从正态分布,平均体重x=15.5公斤,标准差s=1.9公斤。今有一女孩生后随母亲接触铝尘,3岁时其体重为12公斤。按99%的正常值范围衡量,问此女孩体重是否正常?
答:x±2.58*SD=15.5±4.902=(10.598,20.402) 12在该范围内,故正常。
2. 从某地20岁男青年中随机调查120名,根据他们的身高和体重测量结果计算均数和标准差,算得身高X(厘米)为166.06±4.95,体重Y(公斤)为53.72±4.47。试回答下列问题:
(1)选择适当统计指标直观判断两者离散程度的大小;
(2)该地区全部20岁男青年的平均身高是多少(P=0.95)?
(3)从该地区任抽一名20岁男青年,测得他的体重为70公斤,问能否怀疑他的体重异常(P=0.99)?(10分)NO
答:(1)变异系数。CV=S/x* 100% 体重的变异系数大。
(2)x±1.96*SE=166.06±1.96*4.95/(120的根号)=166.06±0.886 (3)x±2.85*SD=53.72±2.58*4.47=(42.1874,65.2526) 是
3. 为了检验一组针麻刺激是否有效,用家兔20只,对同一家兔在腹部两侧切口A、B作针
麻与无针麻的手术,比较其痛感,判断依据是切割时的挣扎反应量(mm)。试列出该实验设
在同源配对设计基础上发展的双因素设计。 它可在同一病人身上观察两种或多种处理的效应。 计的步骤。 设计:配对分两组;1组, 先A 后B因素, 2组, 先B 后A因素。 (阶段Ⅰ)(阶段Ⅱ) 配对随机化分组。 交叉设计的基本模式见图: 按纳入标准 阶段I 阶段II B处理(测量) A处理(测量) 间确定病人 歇 期 B处理(测量) A处理(测量) 4. 某年某单位报告了果胶驱铅的疗效观察,30名铅中毒工人脱离现场后住院治疗,治疗前测得尿铅均数为0.116 mg/L,血铅均数为1.81 mg/L。服用果胶20天后再测,尿铅均数降为0.087 mg/L,血铅均数降为0.73 mg/L,说明果胶的驱铅效果较好。请评述以上研究。 答:1)缺乏对照组;应设置铅中毒工人服用安慰剂的对照组。
2)没有进行假设检验; 3)
5. 铅浓度升高可能与肾功能不全有关。54名血清尿素升高的病人及按年龄、性别配对的54名对照者的血铅均数中位数和众数如下:
表1集中趋势的指标(μmol/L)
均数 中位数 众数
血清尿素升高的对象
1.73 1.44 1.25
对照者 1.33 1.31 1.25
(1)这两组集中趋势指标告诉我们这两个分布呈什么形状? 血清尿素升高组呈正偏态分布,对照组呈正态分布。
(2)当一种分布象血清尿素升高者这种类型时,均数会使人误以为是一组的一个典型指标,为什么?
(3)如何比较血清尿素升高者与对照组之间平均血铅含量的差别?(写明方法与步
骤,不必计算)
符号秩检验:
1. 建立检验假设,确定检验水平 H0:配对数据差值为0 H1:配对数据差值不为0 2.计算统计量
①省略所有差值为0的对子数
②按差值的绝对值从小到大编秩,相同秩(ties)则取平均秩 ③任取正秩和或负秩和为T 3.确定概率P并作统计推断
1.某年某单位报告了果胶驱铅的疗效观察,30名铅中毒工人脱离现场后住院治疗,治疗前测得尿铅均数为0.116 mg/L,血铅均数为1.81 mg/L。服用果胶20天后再测,尿铅均数降为0.087 mg/L,血铅均数降为0.73 mg/L,说明果胶的驱铅效果较好。请评述以上结论是否正确。
2.某医生欲观察叶酸(A)和铁剂(B)治疗贫血患者的疗效及最佳给药方式,治疗一定时间后,记录血红蛋白的增加克数(g/L),测得数据如下表所示,请讨论下列问题:
(1)此资料为何种设计?
(2)此资料是什么性质的资料?并指出它的定义。 (3)分析比较的统计指标是什么?
(4)你认为用什么统计方法可以分析最佳给药方式是什么?(请写出分析检验过程)
表1 不同给药方式的血红蛋白增加克数(g/L)
铁剂 10 15 10 12 15
叶酸+ 5 10 8 7 5
铁剂++叶酸+
30 25 40 35 30
铁剂-+叶酸-
0 -2 -1 -2 0
3..对121名前列腺癌患者治疗,其中80名接受电切术治疗,术后有合并症者11人;41名接受开放手术治疗,术后有合并症1人。试分析两种手术的合并症发生率有无差异?
4.某工厂2000年初有工人500人,从第三季度开始新增了400人,2000年度内新老工人中无一人离厂。在2000年度内,工人患感冒300例,急性胃肠炎50例,外伤25例,皮肤感染25例,其他急性病100例。在2000年度内新发现高血压3例,心脏病3例,糖尿病2例,肺结核2例。2000年前患病至本年末尚未痊愈者,有高血压20例,心脏病7例,糖尿病3例,肺结核2例,其他慢性疾病28例。该厂于每年6月对全厂工人进行一次例行的肺部X光检查,2000年6月全体工人都参加了检查,共检出了3例肺结核。请根据上述资料计算有关的疾病统计指标,并作简要分析。
5.下面的回归方程来自对16个诊断为糖尿病患者的研究,他们接受某种治疗已一年。 Y=-34+0.29X
(Y是病人开始治疗之后一年里所减轻的体重,X是病人治疗开始时的体重。) 请在这项研究资料的基础上作出合理的解释。
6.某地抽样调查10000名成人的血压值(近似正态分布)。结果如下: 收缩压的均数=110,标准差=11,舒张压的均数=73,标准差=11。 血压单位:mmHg 问:(1)从中随机抽取一人,测的其舒张压在73±1.96×11这一范围内的可能性为多少? (2)若以舒张压≥95为高血压,试按正态分布原理估计这10000人的高血压患病 率约为多少?
(3)试以95%的概率估计当地全体成年人收缩压均数的范围。 (4)这群人收缩压与舒张压的变异程度是否相同?为什么?
7.血压有时升高有时正常的病人引起一个复杂的问题。研究对象是男人,它们至少有一次收缩压超过140mmHg或舒张压超过90mmHg,并且在多次看门诊时至少有一次读数在140/90mmHg以下。以年龄相仿而血压从未超过140/90mmHg的男人为对照组。高血压组中找出了一个亚组,这个亚组是由在家测量的血压转为正常的男人组成的。我们的兴趣在于确定非稳定型高血压病人可用以与血压正常者相鉴别。
(1)将下表的各项测量值算出95%可信区间。
表2不同血压分组对象的临床特征 (均值或比例±SE) 特 征
门诊检查正常者 (N=49)
门诊检查可疑 在家正常者
(N=31)
体重(公斤)
心率(每分钟心跳数) 家族史阳性(%)
70.6±1.5 70.9±1.4 24.4±6.1
81.3±1.9 83.1±2.1 41.9±8.9
(2). 你认为哪些特征的差异太大因而不能单纯用“抽样误差”来解释?为什么? 下列规则用于确立哪些可疑高血压病例可以认为是在家时读数正常的人。当某人在家读数与那些门诊收缩压与舒张压正常者(对照组)在家读数的均数相比,不超过一个标准差者,则将他分到在家读数正常组中。
(3).此规定的理论根据是什么?
8.比较A、B两药引起呕吐反应的差别,使每个受试病人以随机次序先后服A、B两药,试验100个病人,有人拟用下述四格表作统计分析。
A、 B两药呕吐反应
分组 服A药 服B药 合计
呕吐 18 10 28
不呕吐 82 90 172
合计 100 100 200
(1) 你认为用上述四格表做统计分析是否恰当?为什么? (2) 如你认为上述分析不恰当,请说明用那一种正确的统计方法。