第七章 参数估计
练 习 题
一、 最佳选择题
1.某疗养院测得100名飞行人员红细胞数(10均数为
4.14
(101212L),经检验该资料服从正态分布,其
12L),标准差为
0.43(10L),求得的区间
(4.14-1.96?0.43/10?4.14+1.96?0.43/10),称为红细胞数的 ( )。
A. 99%参考值范围 B. 95%参考值范围 C.99%可信区间 D. 95%可信区间 E. 90%可信区间
2.设某人群的身高值X?N?155.4, 5.32?,现从该总体中随机抽出一个n =10的样本,得均数X?158.36cm、S=3.83cm,求得?的95%可信区间为(155.62,161.10),发现该区间没有包括总体均数155.4。若随机从该总体抽取n=10的样本200个,每次都求95%可信区间,问大约有多少个不包括总体均数155.4cm在内可信区间( )。
A. 5个 B. 20个 C.10个 D.1个 E.3个
3.某指标的均数为X,标准差为S,由公式?X?1.96S,X?1.96S?计算出来的区间,常称为( )。
A. 99%参考值范围 B. 95%参考值范围 C.99%可信区间 D. 95%可信区间 E. 90%可信区间
4.样本率p与总体率?均已知时,计算样本率p的抽样误差的公式为( )。 A.
p?1?p?n B.
p?1?p?n?1 C.
??1??n?
D.
??1??n?1? E.
??1??n?2?
5.在已知均数为?, 标准差为?的正态总体中随机抽样,X???( )的概率为5%。
A.1.96? B. 1.96?X C. t0.05/2,?S D. t0.05/2,?SX E. t0.05/2,??X
二、问答题
1. 用什么统计指标说明样本统计量抽样误差的大小?以样本均数为例,说明抽样误差的大小主要受哪些因素的影响?
2.什么叫做区间估计?它和医学参考值范围有什么区别?
3. 标准差与标准误的区别与联系是什么? 4. 可信区间的涵义是什么?
5.小结本章介绍了哪些统计是可信区间的估计方法。在哪些情况下,可信区间的估计采用u界值;在哪些情况下,采用t界值?
三、计算题
1. 对10名正常男子空腹测定血糖结果为93,102,110,102,98,109,92,97,100,103(mg%),求正常男子空腹血糖值的95%可信区间?
2. 某地抽查了部分健康成年人的红细胞数结果如下表。
健康成年人的红细胞数测定值(?1012/L)
性别 男 女
例数 360 255
X S
4. 66 0.57 4.18 0.29
试估计该地健康成年男、女的红细胞数的95%可信区间,男、女的红细胞数差值的95%可信区间。
3.某单位抽样测定了31名蓄电池厂工人的尿氨基-?-酮戊酸(ALA)含量(mmol/L),均数为53.8662,方差为2460.4768;同时测定6名化工厂工人的尿ALA含量作为对照,均数为26.5640,方差为52.6150。本例方差不齐(见例10-5),试分别估计蓄电池厂工人尿ALA含量和化工厂工人的尿ALA含量的95%可信区间,并将两可信区间的比较结果与例10-5的假设检验结果比较。
4.用某药治疗患某病的200名患者,有效180名,有效率为90%,试求该药总体有效率的95%可信区间。
5.某县抽查10名献血者的乙型肝炎表面抗原(HBsAg)携带情况,阴性8人,试计算该县献血者HBsAg阴性率的95%的可信区间。
6.某山区小学调查男生80人,其中肺吸虫感染23人,感染率28.8%;调查女生85人,肺吸虫感染15人,感染率17.7%,试计算该地男女肺吸虫感染率差值的95%的可信区
间。
练习题答案
一、选择题
1.D 2.C 3.B 4.C 5.B
二、问答题
1.答:用样本统计量的标准误来说明样本统计量抽样误差的大小。当样本量n一定时,
??就越大,样本均数的抽样误差就越大;?越小,?X?越大,即样本的个体差异越大,?X??就越小,即样本均数抽样误差就越小。当?固定时,n越大,?X就越小;n越小,?X就
越大。故影响抽样误差大小的主要因素是样本量。
2.答:区间估计是利用样本信息计算出一个区间,并同时给出重复试验时该区间包含总体均数或总体率的概率。它与医学参考值范围的主要区别是:
①含义不同,可信区间是用来对总体参数值进行推断的,而医学参考值范围是用来评价临床上的每个个体某个检验值是否超出所谓的正常范围。
②计算公式不同,以大样本正态95%的概率为例,可信区间为均值加减1.96倍的标准误即x?1.96sx?x?1.96s/x?1.96s。
n,而医学参考值范围是均值加减1.96倍的标准差即
3.答:区别:标准差的大小描述个体值与均数的平均误差大小,标准误的大小反映含量相同的样本均值与总体均值的平均误差大小。
联系:标准误等于标准差除样本含量的开方即sx?s/n 4.答:可信区间的涵义:对于一个给定的概率,我们可以认为该区间包含了总体参数,而不能认为总体参数以这个给定的概率落在这个区间里。因为计算出的区间是变化的而总体参数值是固定的。以均数的95%可信区间为例,在同一总体中作100次抽样,可得100个可信区间,平均有95个可信区间包含总体均数μ(估计正确),只有5个可信区间不包含总体均数μ(估计不正确),或对于某一个区间而言,它包含总体均数μ的可能性为95%,而
不包含总体均数μ的可能性仅为5%。
5.答:本章介绍了正态分布法和t分布法。①?未知时,按t分布原理,采用t界值。②?已知时,按正态分布原理采用u界值;?未知但n足够大时,?用样本标准差作为估计值,采用u界值。
三.计算题
1.解:已知 X?5.63,S?95%的可信区间为 x?t/?,vs 5?3=10-1=9 t0.05,9?2.262 0.3=n5.63?2.262?0.353/10?5.63?2.525?8.155?3.105
2.解:由于是大样本,所以采用x?u?s/男性95%的可信区间为 x?u?s/n来计算
n?4.66?1.96?0.57/360?4.60?4.72
女性95%的可信区间为 x?u?s/n?4.18?1.96?0.29/255?4.14?4.22
差值95%的可信区间为
(X1?X2)?u?/2,vSX??4.66?4.18??1.96?0.5736021?X2?0.292552?0.41?0.55
3.解:①n1?31,??31?1?30,??0.05,得t0.05/2,30?2.042,S?49.6代入公式:
22.042? 53.866-
49.630<?<53.8662+2.042?49.630
即 35.3 8<?<72.36或(35.38,72.36)
蓄电池厂工人尿ALA含量的95%的可信区间为35.38~72.36(mmol/L) ②n1?6,??6?1?5,??0.05,得t0.05/2,6?2.447,S?7.25代入公式:
02.447? 26.564-
7.256<?<26.5640+2.447?
7.256 即 19.3 2<?<33.81或(19.32,33.81)
化工厂工人的尿ALA含量的95%的可信区间为19.32~33.81(mmol/L)
4.解:因为是大样本,所以总体率的95%的可信区间为
p?u?/2Sp?0.90?1.96?0.90?1?0.90?200?0.86?0.94?86%?94%
5.解:因为是小样本,所以查附表7,得阳性率的95%的可信区间是3—56,阴性率的95%的可信区间是100-56—100-3即44%—97%。
6.解:由下式公式计算两总体率之差的95%的可信区间
(p1?p2)?u?/2Sp1?p2?
?5 (0.2870.1?765)0.2875?(11.96800.2875)?0?.1765(1
850.1765)??0.017?0.23?9?1.7%?~ 2
该地男女肺吸虫感染率差值的95%的可信区间为-1.7%~-23.9%。