第十一编 统计、统计案例
§11.1 抽样方法
基础自测
本是 . 答案 200个零件的长度
1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,总体的一个样
2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法:①简单随机抽样,②系统抽样,③分层抽样中的 . 答案 ①②③
3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 . 答案 3,9,18
4.(2008·广东理)某校共有学生2 000名,各年级男、女生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为 .
一年级 二年级 三年级 女生 373 x y 男生 答案 16
377 370 z 5.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量n= . 答案 80
例1 某大学为了支援我国西部教育事业,决定从2007应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请
用抽签法和随机数表法设计抽样方案. 解 抽签法:
第一步:将18名志愿者编号,编号为1,2,3,?,18.
第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签; 第三步:将18个号签放入一个不透明的盒子里,充分搅匀; 第四步:从盒子中逐个抽取6个号签,并记录上面的编号; 第五步:所得号码对应的志愿者,就是志愿小组的成员. 随机数表法:
第一步:将18名志愿者编号,编号为01,02,03,?,18.
第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读; 第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09.
第四步:找出以上号码对应的志愿者,就是志愿小组的成员.
例2 某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施. 解 (1)将每个人随机编一个号由0001至1003. (2)利用随机数法找到3个号将这3名工人剔除. (3)将剩余的1 000名工人重新随机编号由0001至1000. (4)分段,取间隔k=
1000=100将总体均分为10段,每段含100个工人. 10(5)从第一段即为0001号到0100号中随机抽取一个号l.
(6)按编号将l,100+l,200+l,?,900+l共10个号码选出,这10个号码所对应的工人组成样本. 例3 (14分)某一个地区共有5个乡镇,人口3万人,其中人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人
的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.
解 应采取分层抽样的方法. 过程如下:
(1)将3万人分为五层,其中一个乡镇为一层.
5分
(2)按照样本容量的比例随机抽取各乡镇应抽取的样本. 300×300×300×
3分
32=60(人);300×=40(人); 151552=100(人);300×=40(人); 15153=60(人), 15
10分 12分 14分
因此各乡镇抽取人数分别为60人,40人,100人,40人,60人. (3)将300人组到一起即得到一个样本. 情况,采
例4 为了考察某校的教学水平,将抽查这个学校高三年级的部分学生本年度的考试成绩.为了全面反映实际取以下三种方式进行抽查(已知该校高三年级共有20个班,并且每个班内的学生已经按随机方式编好了学号,假定该校每班学生的人数相同):①从高三年级20个班中任意抽取一个班,再从该班中任意抽取20名学生,考察他们的学习成绩;②每个班抽取1人,共计20人,考察这20名学生的成绩;③把学生按成绩分成优秀、良好、普通三个级别,从其中共抽取100名学生进行考察(已知该校高三学生共1 000人,若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人). 根据上面的叙述,试回答下列问题:
(1)上面三种抽取方式的总体、个体、样本分别是什么?每一种抽取方式抽取的样本中,样本容量分别是
多少?
(2)上面三种抽取方式各自采用的是何种抽取样本的方法? (3)试分别写出上面三种抽取方式各自抽取样本的步骤.
解 (1)这三种抽取方式的总体都是指该校高三全体学生本年度的考试成绩,个体都是指高三年级每个学生本年度的考试成绩.其中第一种抽取方式的样本为所抽取的20名学生本年度的考试成绩,样本容量为20;第二种抽取方式的样本为所抽取的20名学生本年度的考试成绩,样本容量为20;第三种抽取方式的样本为所抽取的100名学生本年度的考试成绩,样本容量为100. (2)三种抽取方式中,第一种采用的是简单随机抽样法; 第二种采用的是系统抽样法和简单随机抽样法; 第三种采用的是分层抽样法和简单随机抽样法. (3)第一种方式抽样的步骤如下:
第一步,首先用抽签法在这20个班中任意抽取一个班.
第二步,然后从这个班中按学号用随机数表法或抽签法抽取20名学生,考察其考试成绩. 第二种方式抽样的步骤如下:
第一步,首先用简单随机抽样法从第一个班中任意抽取一名学生,记其学号为a.
第二步,在其余的19个班中,选取学号为a的学生,加上第一个班中的一名学生,共计20人. 第三种方式抽样的步骤如下:
第一步,分层,因为若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人,所以在抽取样本时,应该把全体学生分成三个层次.
第二步,确定各个层次抽取的人数.因为样本容量与总体的个体数之比为:100∶1 000=1∶10,所以在每个层次中抽取的个体数依次为
150600250,,,即15,60,25. 101010第三步,按层次分别抽取.在优秀生中用简单随机抽样法抽取15人;在良好生中用简单随机抽样法抽取60人;在普通生中用简单随机抽样法抽取25人.
1.有一批机器,编号为1,2,3,?,112,为调查机器的质量问题,打算抽取10台入样,问此样本若采用简单随机抽样方法将如何获得?
解 方法一 首先,把机器都编上号码001,002,003,?,112,如用抽签法,则把112个形状、大小相同的号签放在同一个箱子里,进行均匀搅拌,抽签时,每次从中抽出1个号签,连续抽取10次,就得到一个容量为10的样本.
方法二 第一步,将原来的编号调整为001,002,003,?,112.
第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如:选第9行第7个数“3”,向右读.
第三步,从“3”开始,向右读,每次读取三位,凡不在001~112中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到074,100,094,052,080,003,105,107,083,092.
第四步,对应原来编号74,100,94,52,80,3,105,107,83,92的机器便是要抽取的对象.
2.某单位在岗职工共624人,为了调查工人用于上班途中的时间,该单位工会决定抽取10%的工人进行调查,请问如何采用系统抽样法完成这一抽样?
解 (1)将624名职工用随机方式编号由000至623. (2)利用随机数表法从总体中剔除4人.
(3)将剩下的620名职工重新编号由000至619. (4)分段,取间隔k=
620=10,将总体分成62组,每组含10人. 62(5)从第一段,即为000到009号随机抽取一个号l.
(6)按编号将l,10+l,20+l,?,610+l,共62个号码选出,这62个号码所对应的职工组成样本. 3.某电台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000人,其中持各种态度的人数如下表:
很喜爱 2 435 喜爱 4 567 一般 3 926 不喜爱 1 072 电视台为进一步了解观众的具体想法和意见,打算从中抽取60人进行更为详细的调查,应当怎样进行抽样?
解 可用分层抽样方法,其总体容量为12 000.“很喜爱”占爱”占爱”占
24352435,应取60×≈12(人);“喜
12000120004567456739263926,应取60×≈23(人);“一般”占,应取60×≈20(人);“不喜
1200012000120001200010721072,应取60×≈5(人).因此采用分层抽样在“很喜爱”、“喜爱”、“一般”和“不喜
1200012000爱”的2 435人、4 567人、3 926人和1 072人中分别抽取12人、23人、20人和5人.
4.某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,?,270,使用系统抽样时,将学生统一随机编号为1,2,?,270,并将整个编号依次分为10段,如果抽得号码有下列四种情况: ①7,34,61,88,115,142,169,196,223,250; ②5,9,100,107,111,121,180,195,200,265; ③11,38,65,92,119,146,173,200,227,254; ④30,57,84,111,138,165,192,219,246,270. 关于上述样本的下列结论中,正确的是 (填序号). (1)②、③都不能为系统抽样 (2)②、④都不能为分层抽样 (3)①、④都可能为系统抽样 (4)①、③都可能为分层抽样 答案 (4)
一、填空题
1.(2008·安庆模拟)某校高中生共有900人,其中高一年级300人,高二年级200人,高三年级400人,现分层抽取容量为45的样本,那么高一、高二、高三年级抽取的人数分别为 . 答案 15,10,20
2.某牛奶生产线上每隔30分钟抽取一袋进行检验,则该抽样方法为①;从某中学的30名数学爱好者中抽取3人了解学习负担情况,则该抽样方法为②.那么①,②分别为 . 答案 系统抽样,简单随机抽样
3.下列抽样实验中,最适宜用系统抽样的是 (填序号).
①某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样 ②某厂生产的2 000个电子元件中随机抽取5个入样 ③从某厂生产的2 000个电子元件中随机抽取200个入样 ④从某厂生产的20个电子元件中随机抽取5个入样 答案 ③
4.(2008·重庆文)某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是 . 答案 分层抽样法
5.某中学有高一学生400人,高二学生300人,高三学生200人,学校团委欲用分层抽样的方法抽取18名学生进行问卷调查,则下列判断不正确的是 (填序号). ①高一学生被抽到的概率最大 ②高三学生被抽到的概率最大 ③高三学生被抽到的概率最小 ④每名学生被抽到的概率相等 答案 ①②③
6.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是 . 答案 6
7.(2008·天津文,11)一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,应抽取超过45岁的职工 人. 答案 10
8.将参加数学竞赛的1 000名学生编号如下0001,0002,0003,?,1000,打算从中抽取一个容量为50的样本,按系统抽样的方法分成50个部分,如果第一部分编号为0001,0002,?,0020,从第一部分随机抽取一个号码为0015,则第40个号码为 . 答案 0795 二、解答题
9.为了检验某种作业本的印刷质量,决定从一捆(40本)中抽取10本进行检查,利用随机数表抽取这个样本时,应按怎样的步骤进行?
分析 可先对这40本作业本进行统一编号,然后在随机数表中任选一数作为起始号码,按任意方向读下去,便会得到10个号码. 解 可按以下步骤进行:
第一步,先将40本作业本编号,可编为00,01,02,?,39.
第二步,在附录1随机数表中任选一个数作为开始.如从第8行第4列的数78开始.
第三步,从选定的数78开始向右读下去,得到一个两位数字号码59,由于59>39,将它去掉;继续向右读,得到16,由于16<39,将它取出;继续读下去,可得到19,10,12,07,39,38,33,21,后面一个是12,由于在前面12已经取出,将它去掉;再继续读,得到34.至此,10个样本号码已经取满,于是,所要抽取的样本号码是16,19,10,12,07,39,38,33,21,34.
10.某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,如何抽取? 解 用分层抽样抽取. (1)∵20∶100=1∶5,