⑤根据你的结论,你可能犯哪一类统计错误?
3.某年某单位报告了果胶驱铅的疗效观察,30名铅中毒工人脱离现场后住院治疗,治疗前测得尿铅均数为0.116(mg/L),血铅均数为1.81(mg/L)。服用果胶20天后再测,尿铅均数降为0.087(mg/L),血铅均数降为0.73(mg/L),说明果胶驱铅的效果较好。请评述以上研究。
4.为比较胃舒氨与西咪替丁治疗消化性溃疡的疗效,以纤维胃镜检查结果作为判断标准,选20名患者,以病人的年龄、性别、病型和病情等条件进行配对,在纤维胃镜下观察每一患者的溃疡面积减少百分率,面积减少百分率为40%以上者为治疗有效。问:(1)如何将病人分组?(2)如何对结果进行统计分析处理?
5.试就下表资料分析比较甲、乙两医院乳腺癌手术后的5年生存率。
甲、乙两医院乳腺癌手术后的5年生存率(%)
腋下淋巴结 转 移 无 有 合计
甲 医 院
病例数 生存数 生存率 45 35 77.77 710 450 68.38 755 485 64.24
12 乙 医 院
病例数 生存数 300 215 83 42 383 257
生存率
71.67 50.60 67.10
6.假定正常成年女性红细胞数(?10/L)近似服从均值为4.18,标准差为0.29的正态分布。令X代表随机抽取的一名正常成年女性的红细胞数,求:(1)变量X落在区间(4.00,4.50)内的概率;(2)正常成年女性的红细胞数95%参考值范围。 7.为了解某中药治疗原发性高血压的疗效,将44名高血压患者随机分为两组。实验组用该药加辅助治疗,对照组用安慰剂加辅助治疗,观察结果如下表,问:该药治疗原发性高血压是否有效?
两种疗法治疗原发性高血压的疗效
分组 实验组 对照组
例数 23 21
有效 21 5
有效率/% 91.30 23.81
8.某研究者采用配对设计进行实验,比较2种抗癌药物对小白鼠肉瘤抑瘤效果,先将10只染有肉瘤小白鼠按体重大小配成5个对子,每个对子内2只小白鼠随机接受两种抗癌药物,以肉瘤的重量为指标,实验结果见下表。问2种不同的药物的抑瘤效果有无差别?
表2 不同药物作用后小白鼠肉瘤重量(g)
编号 (1) 1 2 3 4 5
A药 (2) 0.82 0.73 0.43 0.41 0.68
B药 (3) 0.65 0.54 0.34 0.21 0.43
9.某胸科医院,同时用甲、乙两法测定202份痰标本中的抗酸杆菌,结果如下表。问甲、乙两法的检出率有无差别?
甲、乙两法检测痰标本中的抗酸杆菌结果
乙 法
甲 法 合 计
+ -
+ 49 25 74 - 21 107 128 合 计 70 132 202
10.某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h)如下表,估计尿肌酐含量(Y)对其年龄(X)的回归方程。
8名正常儿童的年龄X(岁)与尿肌酐含量Y(mmol/24h)※
第6页共7页
编 号 1 年龄X 13 尿肌酐含量Y 3.54 2 11 3.01 3 4 9 6 3.09 2.48 5 8 2.56 6 10 3.36 7 12 3.18 8 7 2.65
※表1中:X?9.5 Y?2.9838 lXX?42 lYY?1.0462 lXY?5.8450
11.某地随机抽样调查了部分健康成人的血红蛋白量,结果见下表。问:该地健康成年男、女血红蛋白含量有无差别?
某年某地健康成年男、女血红蛋白含量(g·L) 性别 男 女
例数 360 255
均数 134.5 117.6
标准差
7.1 10.2
-1
第7页共7页
参考答案
一、名词解释:
1.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。
2.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。
3.等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。等级资料又称有序变量。
4.总体:总体指特定研究对象中所有观察单位的测量值。
5.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。 6.变异:同质个体间研究因素的差异。
7.频数表:用来表示一批数据各观察值在不同取值区间出现的频繁程度(频数)。
8.算术均数:描述一组数据在数量上的平均水平。总体均数用?表示,样本均数用X表示。 9.中位数:将一组观察值由小到大排列,位次居中的那个数。
10.极差:亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。 11.方差:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。
12.标准差:是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。
13.变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。
14.正态分布:若资料X的频率曲线对应于数学上的正态曲线,则称该资料服从正态分布。通常用记号
N(?,?2)表示均数为?,标准差为?的正态分布。
15.标准正态分布:均数为0、标准差为1的正态分布被称为标准正态分布,通常记为N(0,12)。
16.统计推断:通过样本指标来说明总体特征,这种通过样本获取有关总体信息的过程称为统计推断。 17.抽样误差:由个体变异产生的,由于抽样造成的样本统计量与总体参数的差异,称为抽样误差。 18.标准误:通常将样本统计量的标准差称为标准误。
19.可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。
20.参数估计:指用样本统计量估计总体参数。参数估计有两种方法:点估计和区间估计。
21.假设检验中P的含义:指从H0规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。
22.Ⅰ型和Ⅱ型错误:Ⅰ型错误指拒绝了实际上成立的H0,这类“弃真”的错误称为Ⅰ型错误,其概率大小用?表示;Ⅱ型错误,指接受了实际上不成立的H0,这类“存伪”的错误称为Ⅱ型错误,其概率大小用?表示。
23.检验效能:1-?称为检验效能,它是指当两总体确有差别,按规定的检验水准?所能发现该差异的能力。 24.检验水准:是预先规定的,当假设检验结果拒绝H0,接受H1,下“有差别”的结论时犯错误的概率称为检验水准,记为?。
25.方差分析:就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和与自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。通过各变异来源的均方与误差均方比值的大小,借助F分布作出统计推断,判断各因素对观测指标有无影响。
26.随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象的特征相同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区组内的观察对象随机地分配到各处理组,这种设计叫做随机区组设计。
27.相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、构成比、相对比。
28.标准化法是常用于内部构成不同的两个或多个总率比较的一种方法。标准化法的基本思想就是选定一个统一“标准”(标准人口构成比或标准人口数),然后按选定“标准”计算调整率,使之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。
29.构成比(proportion)表示事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明
第1页共11页
各构成部分在总体中所占的比重或分布。常以100%为比例基数。计算公式为
构成比?某一组成部分的观察单位数?100% (5.2)
同一事物各组成部分的观察单位总数2
30.Yates校正:英国统计学家Yates F认为,由于χ分布理论上是一连续性分布,而分类资料是间断性
22
的,由此计算出的χ值不连续,尤其是自由度为1的四格表,求出的概率P值可能偏小,此时需对χ值作连续性校正(correction of continuity),这一校正即所谓的Yates校正(Yates’ correction)。 31.非参数统计:针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题需要一种不依赖总体分布的具体形式的统计分析方法。由于这类方法不受总体参数的限制,故称非参数统计法(non-parametric statistics),或称为不拘分布(distribution-free statistics)的统计分析方法,又称为无分布型式假定(assumption free statistics)的统计分析方法。
32.直线回归:建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种,故又称简单回归。
33.相关系数:又称积差相关系数,以符号r表示样本相关系数,ρ表示总体相关系数。它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。
34.统计图:是将统计指标用几何图形表达,即以点的位置、线段的升降、直条的长短或面积的大小等形式直观的表示事物间的数量关系。
b?0 35.回归系数b:是直线的斜率(slope),其统计意义是当X变化一个单位时Y的平均改变的估计值。
时直线从左下方走向右上方,Y随X的增大而增大;b?0时直线从左上方走向右下方,Y随X的增大而减小;b?0时直线与X轴平行,Y与X无直线关系。b的计算公式为
b?lXY?lXX?(X?X)(Y?Y) ?(X?X)2二、单项选择题:
1.D 2.C 3.B 4.B 5.A 6.B 7.A 8.D 9.C 10.C 11.D 12.B 13.D 14.D 15.D 16.C 17.D 18.A 19.A 20.C 21.B 22.D 23.B 24.B 25.D 26.D 27.D 28.A 29.C 30.B 31.E 32.E 33.A 34.B 35.D 36.D 37.A 38.D 39.A 40.C 41.D 42.E 43.A 44.B 45.A 46.D 47.C 48.B 49.B 50.A 51.B 52.B 53.D 54.A 三、简答题:
1.答:三个指标分别说明:
(1)X为算术均数,说明正态分布或近似正态分布资料的集中趋势; (2)S为标准差,说明正态分布或近似正态分布资料的离散趋势;
(3)X?1.96S可估计正态指标的95%的医学参考值范围,即此范围在理论上应包含总体的95%的个体值。 2.答:频数分布表的用途是: ⑴描述频数分布的类型; ⑵描述频数分布的特征;
⑶便于发现一些特大或特小的可疑值; ⑷便于进一步做统计分析和处理。 3.答:正态分布的面积分布规律是:
(1)X轴与正态曲线所夹面积恒等于1或100%;
(2)区间???的面积为68.27%,区间??1.96?的面积为95.00%,区间??2.58?的面积为
99.00%。
4.答:均数的可信区间与参考值范围的区别主要体现在含义、计算公式和用途三方面的不同,具体如下表所示。
第2页共11页
区别点 意 义 计算 公式
均数的可信区间
按预先给定的概率所确定的未知参数的可能范围。实际上一次抽样算得的可信区间要么包含了总体均数,要么不包含。但可以说:该可信区间有多大(如当?=0.05时为95%)的可能性包含了总体均数。
参考值范围 “正常人”的解剖、生理、生化某项指标的波动范围。
?未知:X?t?/2,?S*
n正态分布:X?u?/2S** 偏态分布:PX~P100?X
?已知:X?u?/2?n**
?未知但n>60: X?u?/2用途
估计总体均数
S** n判断观察对象的某项指标正常与否
* t?/2,?也可用t?,?(对应于单尾概率时)
**u?/2也可用u?(对应于单尾概率时)
5.答:?和P均为概率,其中?是指拒绝了实际上成立的H0所犯错误的最大概率,是进行统计推断时预先设定的一个小概率事件标准。P值是由实际样本获得的,在H0成立的前提条件下,出现等于及大于(或/和等于及小于)现有样本获得的检验统计量值的概率。在假设检验中通常是将P与?对比来得到结论,若P≤?,则拒绝H0,接受H1,有统计学意义,可以认为??不同或不等;否则,若P>?,则不拒绝H0,无统计学意义,还不能认为??不同或不等。 6.答:P值是指从H0规定的总体随机抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量值(如t或u)的概率。当P<0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于通常确定的小概率事件标准0.05。因小概率事件在一次试验中几乎不可能发生,现的确发生了,说明现有样本信息不支持H0,所以怀疑原假设H0不成立,故拒绝H0。在下“有差别”的结论的同时,我们能够知道可能犯I型错误的概率不会大于0.05(即通常的检验水准),这在概率上有了保证。
7.答:单双侧检验首先应根据专业知识来确定,同时也应考虑所要解决问题的目的。若从专业知识判断一种方法的结果可能低于或高于另一种方法的结果,则用单侧检验。在尚不能从专业知识判断两种结果谁高谁低时,用双侧检验。若研究者对低于或高于两种结果都关心,则用双侧检验;若仅关心其中一种可能,则取单侧检验。一般认为双侧检验较保守和稳妥,单侧检验由于充分利用了另一侧的不可能性,故更易得出有差别的结论,但应慎用。
8.答:因为通过假设检验推断作出的结论具有概率性,其结论不可能完全正确,有可能发生两类错误。拒绝H0时,可能犯I型错误;“接受”H0时可能犯II型错误。无论哪类错误,假设检验都不可能将其风险降为0,因此在结论中使用绝对化的字词如“肯定”,“一定”,“必定”就不恰当。
9.答:率和构成比所说明的问题不同,因而绝不能以构成比代率。构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度。例如:以男性各年龄组高血压分布为例,50~60岁年龄组的高血压病例占52.24%,所占比重最大,60~岁组则只占到6.74%。这是因为60~岁以上受检人数少,造成患病数低于50~60岁组,因而构成比相对较低。但不能认为年龄在50~60岁组的高血压患病率最严重,而60岁以上反而有所减轻。若要比较高血压的患病率,应该计算患病率指标。
10.答:方差分析的基本思想就是根据试验设计的类型,将全部测量值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如组间变异SS组间可由处理因素的作用加以解释。通过比较不同变异来源的均方,借助F分布做出统计推断,从而推论各种研究因素对试验结果有无影响。
方差分析的应用条件:①各样本是相互独立的随机样本,均服从正态分布;②相互比较的各样本的总体方差相等,即具有方差齐性。
第3页共11页