抽样调查期中习题(答案)重点讲义资料(2)

2018-12-23 23:22

○2估计现有兔子的平均重量及其标准误差； ○3将比估计方法与均值估计法进行比较，哪一种方法效率高？分析其原因。

解：○1已知：N = 100 ，n = 10 ，设X，Y分别代表上月兔子总重量和本月兔子总重量，则

n10?0.1。 X = 3.1，f = ?N100由表中数据可得：

110110y = ?yi?4 ， x = ?xi?2.9710i=110i=11102sy?(yi?y)2?0.0222?10-1i?1 101s2?(xi?x)2?0.0246?x10-1i?1110syx??(xi?x)(yi?y)?0.01510-1i?1因此，对这批兔子较上月末增重的比率估计为：

y4?R = ??1.3468 x2.97?方差的估计为： R?标准误??1?f(s2?R?2s2?2Rs?)?1?0.1(0.0222?1.34682?0.0246?2?1.3468?0.015)?0.0002474Rv(R)yxyx22nX10?(3.1)差的估计为：

???0.0002474?0.015729 s(R) = v(R)○2对现有兔子的平均重量的比率估计为：

?yR = RX=1.3468?3.1?4.17508 yR方差的估计为：

?2s2?2Rs?)?1?0.1(0.0222?1.34682?0.0246?2?1.3468?0.015)?0.0023775 v(yR)?1?f(s2?Ryxyxn10yR标准误差的估计为：

s(yR) = v(yR)?0.0023775?0.04876 ○3对现有兔子的平均重量的均值估计为：

110y = ?yi?4

10i=1y方差的估计为：

v(y)?1?f21?0.1sy??0.0222?0.001998 n106

因此，得到现有兔子平均重量的比率估计量设计效应的估计为：

? deff = v(yR)0.0023775 =?1.1899 v(y)0.001998对于本问题，均值估计方法的效率比比率估计方法的效率要高。原因是：比率估计是有偏的，

当样本量足够大时，估计的偏倚才趋于零，而本问题中的样本量较小，使用比率估计量时不能忽视其偏倚，所以无法保证估计的有效，使得估计效率比均值估计方法的效率低。

4、对某地区171980户居民家庭收入进行调查，以居民户为抽样单位，根据城镇和乡村将居民划为2层，每层按简单随机抽样抽取300户，经整理得如下数据：层城镇乡村 Nh 23560 148420 yh 15180 9856 Wh 0.137 0.863 sh 2972 2546 试根据此估计：

（1）居民平均收入及其95%的置信区间。

（2）若是按比例分配和奈曼分配时，各层样本量分别应为多少？

解：（1）由题中相关数据资料：yst??Wh?yh?10585 .39(元）h?122Sh v(yst)??W?(1?fh)? ?545.5718?16059.7364?16605.3082（元）nh?1h22ht?1.96 se(Yst)?128.86(元/户），该地区居民平均收入的95%的置信区间为：

Yst?t?se(Yst)?(10332.82,10837.96)元

（2）按比例分配：

n1?n?W1?600?0.137?82(户） n2?n?W2?600?0.863?518(户）按奈曼分配：

nh?n?Wh?ShL

?Wh?1h?Sh2由表中资料：n?600,W1S1?407.164,W2S2?2197.198,?WhSh?2604.362

h?1由上可得根据奈曼分配，各层所需样本容量为：

n1?600?n2?600?407.164?94

2604.3622197.198?506

2604.362

5、某工厂生产的新产品供应国内市场的300家用户，试销售滿一年后，现欲请用户对该厂的新产品进行评价。现把这些用户分成本地区、本省外地区、外省三层。现有资料如下：

本地区本省外地外省区 N1?154 N2?93 2S12?2.25 S2?3.24 N3?53 2S3?3.24 C1?9 C2?25 C3?36 若要求估计评价成绩均值的方差V(yst)?0.1，并且费用最省(假定费用为线性形式)，求样本量n在各层的分配。

(?Ni?i/Ci)(?Ni?iCi)126.38?2102.4?27.06?28 解：n?=

9000?819.54N2S2?yst???Ni?i2NS?yst???Ni?22(?Ni?i/Ci)2i

(?Ni?i/Ci)=

154?1.593?1.853?1.8???126.38 356?N?iiCi)=154*1.5*3?93*1.8*5?53*1.8*6?2102.4

N2S2?yst?=3002?0.12?9000

?N?i2i=154*2.25?93*3.24?53*3.24?819.54

N1?1/C1?28?77?17.059?17

126.3833.48?7.42?7

126.3815.9?3.523?4

126.38n1?n?N?ii/Ci)n2?nN2?2/C2?N?ii/Ci)?28?n3?nN3?3/C3?N?ii/Ci)?28?即各层的样本量分别为17、7、4

6、一个县内所有农场按规模大小分层，各层内平均每个年农场谷物（玉米）的英亩数列在下表中。农场规模（英平均每一农场的玉米面积农场数Nh 标准差Sh 亩） Yh 0—40 394 5.4 8.3 41—80 461 16.3 13.3 81—120 391 24.3 15.1 121—160 334 34.5 19.8 161—200 169 42.1 24.5 201—240 113 50.1 26.0 ?241 148 63.8 35.2 总和或均值 2010 26.3 -- 现要抽出一个包含100个农场的样本，目的是估计该县平均每个农场的玉米面积，请问：（1）按比例分配时，各层的样本量为多少？

（2）按最优分配时，各层的样本量为多少？（假定各层的单位调查费用相等）解：（1）比例分配：

N根据表中所给的数据，利用公式nh?nh直接可计算出各层样本量：

Nn1?20,n2?23,n3?19,n4?17,n5?8,n6?6,n7?7

（2）最优分配：

当各层的单位调查费用相等时，最优分配样本量计算公式为：

nh?n?NhShL

h?NShh?1同样将表中的相关数据代入公式即可求出此时各层的样本量为：

n1?10,n2?18,n3?17,n4?19,n5?12,n6?9,n7?15

7、某县欲调查某种农作物的产量，由于平原、丘陵和山区的产量有差别，故拟划分为平原、丘陵和山区三层采用分层抽样。平原区共有150个村庄，丘陵区共有100个村庄，山区共有250个村庄。按照各种地形等比例各抽取5%样本，进行实割实测产量，结果计算如下表。（1）在95%的概率保证程度下，试估计该县农作物平均每村产量的区间范围。（2）若村庄的农作物产量低于150吨，县政府并将其归为低产量村，从而对其加强农业补贴政策。因此，试图在95%的概率保证程度下估计该县低产量村比例的区间范围。地形村庄总个数样本村个数样本平均产样本产量标样本低产量（吨）准差量村个数平原 140 7 202.5 82.20 2 丘陵 100 5 147 36.84 1 山区 240 12 121.11 47.35 7

解：（1） x?27?202.5?5?147?12?121.11?150.24 7?5?12 样本方差：????ini?ni282.22?7?36.842?5?47.352?12??3374.5

24n3374.5)?(1?5%)?11.56 N24 抽样平均误差ux??2n(1? 概率保证程度为95.45%，可查表获得t=1.96，?x?tux?2?11.56?23.12

在95.45%的概率保证程度下，可得该县农作物平均每村产量的置信区间为（150.24-23.12,

150.24+23.12）。

2?1?7?41.67% （2）样本成数p?7?5?12样本方差

251475??7???5???12pi(1?pi)ni77?551212p(1?p)???0.21

24?ni抽样平均误差up?p(1?p)n0.21(1?)?(1?5%)?9.12% nN24概率保证程度为95.45%，可查表获得t=1.96，?x?tux?2?9.12%?18.24% 在95.45%的概率保证程度下可得该县低产量村比例的置信区间为（41.67%-18.24%，

41.67%+18.24%）

共2页:

抽样调查期中习题(答案)重点讲义资料(2).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档