∴
702010=2,=14,=4
555∴从副处级以上干部中抽取2人,一般干部中抽取14人,从工人中抽取4人.
(2)因副处级以上干部与工人人数较少,可用抽签法从中分别抽取2人和4人;对一般干部可用随机数表法抽取14人.
(3)将2人、4人、14人编号汇合在一起就得到了容量为20的样本.
11.从某厂生产的10 002辆电动自行车中随机抽取100辆测试某项性能,请合理选择抽样方法进行抽样,并写出抽样过程.
解 因为总体容量和样本容量都较大,可用系统抽样. 抽样步骤如下:
第一步,将10 002辆电动自行车用随机方式编号;
第二步,从总体中剔除2辆(剔除法可用随机数表法),将剩下的10 000辆电动自行车重新编号(分别为00001,00002,?,10000)并分成100段;
第三步,在第一段00001,00002,?,00100这100个编号中用简单随机抽样抽出一个作为起始号码(如00006);
第四步,把起始号码依次加间隔100,可获得样本.
12.某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n的样本.如果采用系统抽样法和分层抽样法抽取,不用剔除个体;如果样本容量增加一个,则在采用系统抽样时,需要在总体中先剔除1个个体,求样本容 量n. 解 总体容量为6+12+18=36.当样本容量是n时,由题意知,系统抽样的间隔为抽取工程师
36n,分层抽样的比例是,n36nn×6=(人), 366nn×12=(人), 363抽取技术人员抽取技工
nn×18=(人). 362所以n应是6的倍数,36的约数即n=6,12,18,36.
当样本容量为(n+1)时,在总体中剔除1人后还剩35人,系统抽样的间隔为数,所以n只能取6,即样本容量为6.
3535,因为必须是整n?1n?1
§11.2 总体分布的估计与总体特征数的估计
基础自测
答案 5
1.一个容量为20的样本,已知某组的频率为0.25,则该组的频数为 .
2.(2008·山东理)右图是根据《山东统计年鉴2007》中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为 . 答案 303.6
3.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在该组上的频率为m,该组在频率分布直方图的高为h,则|a-b|= . 答案
m h4.(2008·山东文,9)从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为 .
分数 人数 答案
5 20 4 10 3 30 2 30 1 10 210 55.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁~18岁的男生体重(kg),得到频率分布直方图如下:
根据上图可得这100名学生中体重在[56.5,64.5)的学生人数是 . 答案 40
例1 在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交
作品的件数按5天一组分组统计,绘制了频率分布直方图(如图所示),已知从左到右各长方形高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:
(1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数量最多?有多少件?
(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率高? 解 (1)依题意知第三组的频率为
41=,
2?3?4?6?4?15又因为第三组的频数为12, ∴本次活动的参评作品数为
12=60. 15(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60×(3)第四组的获奖率是
6=18(件).
2?3?4?6?4?1105=, 189第六组上交的作品数量为 60×
1=3(件),
2?3?4?6?4?126=,显然第六组的获奖率高. 39100~200 20 200~300 30 300~400 80 400~500 40 500~600 30 ∴第六组的获奖率为
例2 对某电子元件进行寿命追踪调查,情况如下:
寿命(h) 个数 (1)列出频率分布表; (2)画出频率分布直方图;
(3)估计电子元件寿命在100 h~400 h以内的概率; (4)估计电子元件寿命在400 h以上的概率. 解 (1)样本频率分布表如下:
寿命(h) 100~200 200~300 300~400 400~500 500~600 合计 (2)频率分布直方图
频数 20 30 80 40 30 200 频率 0.10 0.15 0.40 0.20 0.15 1
(3)由频率分布表可以看出,寿命在100 h~400 h的电子元件出现的频率为0.65,所以我们估计电子元件寿命在
100 h~400 h的概率为0.65.
(4)由频率分布表可知,寿命在400 h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h以上的概率为0.35.
例3 为了解A,B两种轮胎的性能,某汽车制造厂分别从这两种轮胎中随机抽取了8个进行测试,下面列出了每一个轮胎行驶的最远里程数(单位:1 000 km) 轮胎A 96, 112, 97, 108, 100, 103, 86, 98 轮胎B 108, 101, 94, 105, 96, 93, 97, 106 (1)分别计算A,B两种轮胎行驶的最远里程的平均数,中位数; (2)分别计算A,B两种轮胎行驶的最远里程的极差、标准差; (3)根据以上数据你认为哪种型号的轮胎性能更加稳定? 解 (1)A轮胎行驶的最远里程的平均数为:
96?112?97?108?100?103?86?98=100,
8中位数为:
100?98 =99; 2B轮胎行驶的最远里程的平均数为:
108?101?94?105?96?93?97?106=100,
8101?97中位数为:=99.
2(2)A轮胎行驶的最远里程的极差为:112-86=26, 标准差为:
42?122?32?82?0?32?142?22221s==≈7.43;
82B轮胎行驶的最远里程的极差为:108-93=15,
标准差为:
82?12?62?52?42?72?32?62118s= =≈5.43.
82(3)由于A和B的最远行驶里程的平均数相同,而B轮胎行驶的最远里程的极差和标准差较小,所以B轮胎性能更加
稳定.
例4(14分)某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30 min抽取一包产品,称其重量,分别
记录抽查数据如下: 甲:102, 101, 乙:110, 115,
99, 90,
98, 85,
103, 75,
98, 115,
99; 110.
(1)这种抽样方法是哪一种? (2)将这两组数据用茎叶图表示;
(3)将两组数据比较,说明哪个车间产品较稳定. 解 (1)因为间隔时间相同,故是系统抽样. (2)茎叶图如下:
5分
(3)甲车间: 平均值:
2分
x1=
1(102+101+99+98+103+98+99)=100, 72
7分 9分
方差:s1=乙车间:
1222
[(102-100)+(101-100)+?+(99-100)]≈3.428 6. 71(110+115+90+85+75+115+110)=100, 7平均值:x2=方差:s2=
2
11分 13分 14分
1222
[(110-100)+(115-100)+?+(110-100)]≈228.571 4. 72
2
∵x1=x2,s1<s2,∴甲车间产品稳定.
1.为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如图所示,已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5.