22.在抽样中先将总体各单位按某种顺序排列,并按某种规则确定一个随机起点,然后,每隔一定的间隔抽取一个单位,直至抽取n个单位形成一个样本。这样的抽样方式称为( C )。
A.简单随机抽样 B.分层抽样 C.系统抽样 D.整群抽样
23.智商的得分服从均值为100,标准差为16的正态分布。现从总体中抽取一个容量为n的样本,样本均值的标准差为2,试求样本容量为( B )。
A.16 B.64 C.8 D.无法确定
三、名词解释
1.概率:概率是对某一特定事件出现可能性大小的一种数值度量。 2.简单随机抽样:从总体中抽取n个单位作为样本时,使得每一个总体单位都有相同的机会(概率)被抽中
3.抽样分布:就是由样本n个观察值计算的统计量的概率分布。
4.样本比率的抽样分布:在重复选取容量为n的样本时,由样本比率的所有可能取值形成的相对频数分布。
四、简答题
关于样本均值的抽样分布,中心极限定理的含义是什么? 答:样本均值的抽样分布:当总体服从正态分布N(μ,σ2)时,在重复抽样条件下,来自该总体的容量为n的样本的均值也服从正态分布, 的数学期望为μ,方差为σ2/n。即~N(μ,σ2/n)
中心极限定理:设从均值为,方差为 2的一个任意总体中重复地抽取容量为n的样本,当n充分大时(通常要求n≥30),样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布 含义:中心极限定理就是一个抽自任意总体样本容量为n的随机样本。当n充分大时,样本均值 的抽样分布将近似于一个具有均值 和标准差 的正态分布。
五、计算题
1.某企业生产的某种电池寿命近似服从正态分布,且均值为200小时,标准差为30小时。若规定寿命低于150小时为不合格品。试求:
(1)该企业生产的电池的合格率是多少?
(2)该企业生产的电池的寿命在200小时左右的多大范围内的概率不小于0.9。 解:已知μ=200,δ=30 (1)
?200P(x?150)??(Z?15030)??(Z??1.67)?0.0475
合格率为1-0.0475=0.9525=95.25%。
或
?200P(x?150)?1?P(x?150)?1??(Z?15030)?1??(Z??1.67)?1?0.0475?0.9525?95.25%
(2)P?X?200?K??P?Z?P?Z?K30X?20030?K30??0.9,即:
??0.95,K/30?1.64,K?49.2小时故该企业生产的电池的寿命在200小时左右的?
49.2范围内的概率不小于0.9。
2.某厂生产的某种节能灯管的使用寿命服从正态分布,对某批产品测试的结果,平均使用寿命为1050小时,标准差为200小时。试求:
(1)使用寿命在500小时以下的灯管占多大比例? (2)使用寿命在850~1450小时的灯管占多大比例?
(3)以均值为中心,95%的灯管的使用寿命在什么范围内? 解:设X=“该种节能灯管的使用寿命”,根据题意:X~N(1050,200),因此,
2P(X?500)?P?Z?(1)
500?1050200??2.75??1??(2.75)?1?0.99702?0.00298
?1050?1050P(850?X?1450)?P(850200?Z?1450)200由此可知该种节能灯管使用寿命在500小时以下的灯管约占0.298%。
(2)
?P(?1?Z?2)??(2)??(?1)?0.97725?0.15865?0.8186
由此可知该种节能灯管使用寿命在850~1450小时的灯管约占81.86%。 (3)P(Z?K)?0.95,由标准正态分布函数值表可知,K=1.96,即有:
X?1050200PZ???1.96?P?X?1050?392??0.95
?95%的灯管的使用寿命在均值左右392小时(即658~1442小时)的范围内。
3.一个具有n=64个观察值的随机样本抽自于均值等于20、标准差等于16的总体。
(1)给出x的抽样分布(重复抽样)的均值和标准差。 (2)描述x抽样分布的形状。你的回答依赖于样本量吗?
(3)计算标准正态z统计量对应于x=15.5的值。 (4)计算标准正态z统计量对应于x=23的值。 (5)计算P(x<16) (6)计算P(x>25) (7)计算P(16≤x≤23)
解:已知 n=64,为大样本,μ=20,σ=16,
(1)在重复抽样情况下,x的抽样分布的均值为?x?20,?x?2
(2)x的抽样分布近似正态分布,回答上述问题依赖于大样本 (3)z?x??x?x?x??x?/n?15.5?2016/64??4.52??2.25
z?(4)
z?(5)
x??x?xx??x??/?x??xn23?203?16??1.5
2/6416?20?16?/64?42x??x?x?/n??2
P(x?16)??(z??2)?1??(z?2)?1?0.9773?0.0227
z?(6)
(7)
x??x?x??/??x??xn25?205?16??2.52 /64P(x?25)?1?P(x?25)?1??(z?2.5)?1?0.9338?0.0662
P(16?x?23)?P16?20166423?20?z?16?P(?2?z?1.5)??(1.5)??(?2)?64?综
?(2)??(1.5)?1?0.9773?0.9332?1?0.9105合练习题(第4章)
一、填空题
1.评价估计量好坏的三个标准是无偏性、有效性和一致性。
?与??相比满足 2.如果估计量?12?)?E(??) E(?12?是比??更有效的一个估计量。 ,我们称?12?是总体参数?的一个无偏估计量。 ?)?? 时,我们称估计量?3.当 E(?4.总体参数估计的方法有 点估计和 区间估计两种。
5.在其他条件相同的情况下,99%的置信区间比90%的置信区间宽。
6.在简单重复抽样条件下,当允许误差E=10时,必要的样本容量n=100;若其他条件不变,当E=20时,必要的样本容量为25。
7.某地区的写字楼月租金的标准差80元,要估计总体均值的95%的置信区间,要求允许误差不超过15元,应抽取的样本容量至少为110。
8.拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元,假定想要估计平均年薪95%的置信区间,希望允许误差为400元,则应抽取97个毕业生作为样本。 9.在其他条件不变的情况下,总体数据的方差越大,估计时所需要的样本越多。
二、单项选择题
1.正态总体方差已知时,在小样本条件下,估计总体均值使用的统计量是( C ) A. t?x??x??x??x?? B. t? C. z? D. z?
?/n?/n?/ns/n2.对于简单随机重复抽样,在其他条件不变的情况下,若要求允许误差E缩小为原来的
一半,则样本容量必须( B )
A. 扩大为原来的2倍 B. 扩大为原来的4倍 C.缩小为原来的1/4 D.缩小为原来的1/2 3.一个95%的置信区间是指( C ) A. 总体参数有95%的概率落在这一区间内 B. 总体参数有5%的概率未落在这一区间内
C. 在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数 D. 在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数 4.当样本容量一定时,置信区间的宽度( B )
A. 随着置信水平的增大而减小 B. 随着置信水平的增大而增大 C. 与置信水平的大小无关 D. 与置信水平的平方成反比 5.当置信水平一定时,置信区间的宽度( A )
A. 随着样本容量的增大而减小 B. 随着样本容量的增大而增大 C. 与样本容量的大小无关 D. 与样本容量的平方根成正比
6.下面说法正确的是( C )
A. 置信区间越宽,估计的准确性越高 B. 置信区间越窄,估计的准确性越低 C. 置信区间越宽,估计的可靠性越大 D. 置信区间越宽,估计的准确性越小 7.正态总体方差未知时,在小样本条件下,估计总体均值使用的统计量是( B ) A. t?x??x??x??x?? B. t? C. z? D. z?
?/ns/n?/ns/n8.参数估计中的估计量是指( A )。
A.用来估计总体参数的统计量的名称 B.用来估计总体参数的统计量的具体数值 C.总体参数的名称 D.总体参数的具体数值
9.估计量的抽样标准误差反映了估计的( A )
A.准确性 B.精确性 C.可靠性 D.显著性 10.在置信水平不变的条件下,要缩小置信区间,则( A ) A.需要增加样本容量 B.需要减少样本容量
C.需要保持样本容量 D.需要改变统计量的抽样标准差
11.在其它条件不变的情况下,要使估计时所需的样本容量小,应该( B ) A.提高置信水平 B.降低置信水平 C.使置信水平不变 D.使置信水平等于1
三、名词解释
1.参数估计:就是用样本统计量去估计总体的参数。
2.区间估计:是在点估计的基础上,给出总体参数估计的一个范围。
3.置信水平:如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比率称为置信水平,或称为置信系数。
4.点估计:就是用样本估计量的值直接作为总体参数的估计值。
四、简答题
1.简述样本容量与置信水平、总体方差、许误差的关系。 答:样本容量与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需的样本容量也就越大;样本容量与总体方差成正比,总体的差异越大,所要求的样本容量也越大;样本容量与允许误差成反比,可以接受的允许误差越大,所需的样本容量就越小。
2.解释置信水平为95%的置信区间。
答:由100个样本样本构造的总体参数的100个置信区间中有95%的区间包含了总体参数的真值,而5%则没有包含,则95%这个值被称为置信水平。
五、计算题
1.某工厂有1500名职工,从中随机抽取50名职工作为样本,调查其工资水平,调查结果如下表: 月工资(元) 职工人数(人) 800 4 850 6 900 9 950 10 1000 8 1050 6 1100 4 1150 3 要求:(1)计算样本平均数和抽样平均误差;
(2)以95%的可靠性估计该厂职工的月平均工资的区间。(计算结果小数点后保留两位)
解:(1)计算样本平均数和样本标准差;
x??800?4?850?6?900?9?950?10?1000?8?1050?6?1100?4?1150?3503200?5100?8100?9500?8000?6300?4400?345050?4805050?961