4.7 某居委会欲了解居民健身活动情况,如果一直该居委会有500名居民,居住
在10个单元中。现先抽取4个单元,然后再样本单元中分别抽出若干居民,两个阶段的抽样都是简单随机抽样,调查了样本居民每天用于健身锻炼的时间结果如下(以10分钟为1个单位): 单元i 居民人数Mi 样本量mi 健身锻炼时间yij 1 32 4 4,2,3,6 2 45 5 2,2,4,3,6 3 36 4 3,2,5,8 4 54 6 4,3,6,2,4,6 试估计居民平均每天用于锻炼的时间,并给出估计的标准差。 (1) 简单估计量 (2) 比率估计量
(3) 对两种估计方法及结果进行评价。 解:(1)简单估计
??NYunNMy??iini?1n?Y?
ii?1n10?(32?3.75?45?3.4?36?4.5?54?4.17) 4 =1650,
=
?Y?1650则Yu?u??3.3,
M05001n?1? 又Yu??Yi??660?165, ni?14?)?所以v(Yu分别计算
N2?)??Y(Y?(1?f)iu1i?1n2nn?1N?nMi(1?f2i)s2i ?mi?1in22?(Y??Y?)iui?1n2n?15778??192631??[(120?165)2?(153?165)2?(162?165)2?(225?165)2] 3Mi(1?f2i)s2i??mi?1in22322?(1?454)?2.92452?(1?)?2.8362?(1?)?7324536??454542?(1??
6)?2.254?4628.486?22nMi(1?f2i)s2i???mi? i?1??n??)2??Y(Y?iu2??1N(1?f1)i?1N?v(Yu)??所以,M0?nn?1n???0.11556?0.046285?0.162??所以标准差s(Yu)?v(Yu)?0.402 (2) 比率估计
n?R?y?Mi?1ni?1iyi?i?MN232?3.75?45?3.4?36?4.5?54?4.17?3.9532
32?45?36?54?R)?v(y?)??Y(Y?(1?f)iu1i?1n2nn?1NnMi(1?f2i)s2i ??ni?1mi22?Y?其中YR?R?M0?Mi?1ni?1niyi
i?M?R)?v(y?)v(YRM02?0.0715
?R)?v(y?R)?0.0715?0.2647 s(y??R)?0.2647 (3)?简单估计标准差s(Yu)?0.402,比率估计标准差s(y?比率估计更好
第五章不等概抽样习题答案
5.1解:
分析题目可知“代码法”与“拉希里法”都是PPS抽样(放回的与规模大小
成比例的不等概抽样)的实施方法,而此题需要用此两种方法进行不放回抽样,故需进一步进行改进:即采用重抽法抽取,如果抽到重复单元,则放弃此样本单元,重新抽取,直到抽到规定的样本量且所有样本党员不重复: (1) 代码法:由Zi=
MiM?Ni可假设M0=1000000,则Mi=ZiM0列成数据表M0?Mii?1为: PSU 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Mi 110 18556 62999 78216 75245 73983 76580 38981 40772 22876 3721 24971 40654 14804 5577 70784 69635 34650 累计Mi 110 18666 81665 159881 235126 309109 385689 424670 465442 488318 492039 517010 557664 572468 578045 648829 718464 753114 代码 1~110 111~18666 18667~81665 81666~159881 159982~235126 235127~309109 309110~385689 385690~424670 424671~465442 465443~488318 488319~492039 492040~517010 517011~557664 557665~572468 572469~578045 578046~648829 648830~718464 718465~753114 753115~822606 36590 859296 822607~20 859296 33853 893049 859297~21 893049 16959 910008 893050~22 910008 9066 919074 910009~23 919074 21795 940869 919075~24 940869 59185 1000054 940870~25 1000054 我们看到抽取的范围比较大,所以我们利用计算机中的随机数表来抽取,第一个随机数为444703, 615432, 791937, 921813 , 738207, 176266, 405706 935470, 916904, 57891按照范围我们可以知道抽取的PSU9, PSU16, PSU19, PSU24, PSU18, PSU2, PSU8 PSU24 PSU23 PSU2,我们看到第2组和24组重复抽取了,故进行重新抽取,抽到4组和6组; 综上所述,抽取的样本为2,4,6,8,9,16,18,19,23,24组
19 (2)拉希里法:M?=78216,N=25,在[1, 25]和[1, 78216]中分别产生(n,m): (13,38678),M13=40654?38678,入样; (8, 57764),M8=38981<57764,舍弃,重抽; (23,13365),M23=9066<13365,舍弃,重抽; (19,38734),M19=69492?38734,入样;
以此类推,当得到重复入样情况时,同上重新抽取,得到抽取结果为: 2,3,5,6,7,12 ,13,16, 19,24组 5.2解:
由数据可得:
t1=?y1j=20, t2??y2j?25,t3=38, t4=24, t5=21;
j?1j?1MiM269492 822606 结合t值数据,我们可以推得Z的值 Z1=
M15??0.2,Z2=0.16,Z3=0.32,Z4=0.2,Z5=0.12, M025由公式?ij?4ZiZj?1?Zi?Zj??1?2Zi??1?2Zj???1???样本 1,2 1,3 1,4 1,5 2,3 2,4 2,5 3,4 3,5 4,5 ?Zii?11?2ZiN????
?ij 0.273769 0.217405 0.283079 0.243826 0.166251 0.213142 0.243826 0.603903 0.53546 0.243826 5.3 解:
设:M0=1,则有:Mi?Zi,得到下表: i Mi 0.104 0.192 0.138 0.062 0.052 0.147 0.089 0.038 0.057 0.121 1 Mi?1000 104 192 138 62 52 147 89 38 57 121 1000 累计代码 Mi?1000 1 2 3 4 5 6 7 8 9 10 104 296 434 496 548 695 784 822 879 1000 1—104 105—296 297—434 435—496 497—548 549—695 696—784 785—822 823—879 880—1000 ? 先在[1,1000]中产生第一个随机数为731,再在[1,1000]里面产生第二个随机数为103,最后在[1,1000]中产生第三个随机数为982,则它们所对应的第7、1、10号单元被抽中。 5.4 解:
利用汉森-赫维茨估计量对总体总值进行估计: