高中数学必修三第二章--统计
一、随机抽样(等可能,N个中抽n个,每个元素被抽到的概率为
n) N1、简单随机抽样(抽签法;随机数表法—编号位数相同,读数去掉超范围的和重复的)
2、系统抽样(总体和样本容量大且均衡;抽多少个,分多少组,每组取一个;第一组确定后,其余各组同位置或按事先制定的规则取数;等距抽样:k,k?NNN,k?2,?k?(n?1)) nnn3、分层抽样(各组不均衡;按比例抽取;两种算法—纵向算比例和横向算比例)
【典型例题-基本概念】
1、为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是()
A、总体是240 B、个体是每一个学生 C、样本是40名学生 D、样本容量是40 2、老师为研究男女同学数学学习的差异情况,对某班50名同学(其中男同学30名,女同学20名)采取分层抽样的方法,抽取一个样本容量为10的样本进行研究,某女同学甲被抽到的概率为( )
A.
1 50B.
1 10C.
1 5 D.
1 4【典型例题-三种抽样方法】
1、某工厂的质检人员对生产的100件产品,采取随机数表法抽取10件进行检查,对100件产品采用下面的编号方法:
①1,2,3,?,100; ②001,002,?,100; ③00,01,02,?,99; ④01,02,03,?,100. 其中正确的是( )
A.②③④ B.③④ C.②③ D.①②
2、总体由编号为01,02,?,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )
A.08
B.07
C.02
D.01
3、有40件产品,编号从1到40,先从中抽取4件检验,用系统抽样方法确定所抽的编号为()
A 5,10,15,20 B 2,12,22,32 C 2,14,26,38 D 5,8,31,36 4、某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,?,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )
A.1l B.12 C.13 D.14
5、一个总体中有100个个体,随机编号为0,1,2,?,99,依编号顺序平均分成10个小组,组号依次为1,2,3,?,10,现用系统抽样方法抽取一个容量为10的样本.规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码的个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码 是。
6、某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从他们中抽取一个容量为36的样本,则适合的抽取方法是()
A 简单随机抽样 B 系统抽样 C 分层抽样 D 先从老人中剔除1人,然后再分层抽样 7、某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为()
1 / 12
A、15,5,25 B、15,15,15 C、10,5,30 D、15,10,20 二、频率分布直方图、平均数、方差 1、频率分布直方图:(1)根本:纵轴→
频率频率h矩形?(2)三考点:①频率=S小长方形②面积和=1③组距组距频数=样本容量?频率
2、平均数和方差(1)平均数描述数据的平均水平,定量的反映了数据的集中趋势所处的水平;方差描述
数据的离散程度,描述了一组数据围绕平均数波动的大小。
(x1?x)2?(x1?x)2??(xn?x)2(类比平均分)一组数据x1,x2,?,xn平均数x,S??x2?(x)2(2)
n方差S2,则数据ax1?b,ax2?b,?,axn?b的平均数为ax?b,方差为a2S2,即数据加减乘除,平均数
2同步加减乘除;数据加减,方差不变;数据乘除,方差变为原来的平方倍。(3)方差是数据在平方级别上的相应波动,对原始数据的波动有所放大,要看原始数据的平均差别,引入标准差的概念。 3、各数据特征在频率分布直方图中的直观表示:(1)众数:众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标(2)中位数:在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值(3)平均数:是频率分布直方图的“重心”,左右数据的重量相等。估算(4)方差:方差越小,数据越向中x?x1?f1?x2?f?2?xn?fn,其中xi为各组小长方形横坐标的中点。间(平均数)集中,图像越尖;方差越大,越大数据越向两极(极大极小)分散,图像越坡。
例如:
中,x甲?x乙(甲数据大的多,小的少;乙数据大的少,小的多)
中,S甲2?S乙2?S丙2
【典型例题—频率分布直方图】
1、青少年的视力水平的下降已经引起全社会的关注,某校为了了解高二年级500名学生的视力情况,从中抽查一部分学生视力,通过数据处理,得到如下频率分布直方图:
分组 3.95~4.25 4.25~4.55 4.55~4.85 4.85~5.15 5.15~5.45 合计 频数 2 6 25 2 频率 0.04 0.12 0.04 1.00 视力 3.95 4.25 A 4.85 B5.45 频率 组距 D C 请你根据给出的图表回答:
(1)填写频率分布表中未完成部分的数据。 2 / 12
(2)在这个问题中,总体是,样本容量是。
(3)在频率分布直方图中梯形ABCD的面积是。
2、某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )
A.45 B.50 C.55 D.60
3、在样本频率分布直方图中共有11个小矩形,若中间一个小矩形的面积等于所有各小矩形面积和的样本容量是160,则中间一组的频数是()
A、0.2 B、0.25 C、32 D、40
1,44、已知200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在[60,70)的汽车大约 有辆.
5、若某产品的直径长与标准值的差的绝对值不超过1 mm时,则视为合格品,否则视为不合格品,在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5 000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:
分组 [-3,-2) [―2,―1) (1,2] (2,3] (3,4] 合计 频数 8 10 50 频率 0.10 0.50 1.00 (1)将上面表格中缺少的数据填在相应位置.
(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率.
(3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品,据此估算这批产品中的合格品的件数.
【典型例题—平均数、方差、标准差】 1、【技巧】求101、98、102、100、99这五个数的平均数是,方差是
2、一组数据的方差为s2,将这组数据中的每一个数都乘以2,所得到的一组新数据的方差为()
A、
12s 2B、2s
2C、4s
2D、s
23 / 12
3、若样本数据x1?1,x2?1,?,xn?1的平均数为10,方差为2,那么样本数据x1?2,x2?2,...,xn?2的平均数为,方差为。
☆4、(方差变大变小可以估计一下即得答案,当然也可以算)某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有两名同学的分数登记错了,甲实得80分,却记了50分,乙实得70分,却记了100分,更正后平均数和方差分别是()
A、70,75 B、70,50 C、75,1.04 D、65,2.35
na?mbnm?a?b)数据x1,x2,?,xn的平均数为a,数据y1,y2,?,ym的平
m?nm?nm?n13m均数为b,若样本数据x1,x2,?,xn,y1,y2,?,ym的平均数为c?a?b,则的值为()
44n11 A、3 B、4 C、 D、
43☆5、(提示:c?☆【典型例题—用频率分布直方图估计样本的数字特征】
1、如图是一样本的频率分布直方图,则由图中的数据,可以估计众数与中位数分别是() A.12.5,14 B.12.5,13 C.13,12.5.2014 D.13,13
2、某校100名学生的数学测试成绩频率分布直方图如图所示,分 数不低于a即为优秀,如果优秀的人数为20人,则a的估计值是( ) A.130 B.140 C.133 D.137
3、某中学团委组织了“弘扬奥运精神,爱我中华”的知识竞赛,从参加考试的学生中抽出60名学生,将其成绩(均为整数)分成六组[40,50),[50,60),?,[90,100]后,画出如图所示的部分频率分布直方图.观察图形给出的信息,回答下列问题:
(1)求第四组的频率,并补全这个频率分布直方图;
(2)估计这次考试的及格率(60分及以上为及格)、众数、中位数和平均分(同一组中的数据用该组区间的中点值作代表)
4 / 12
【典型例题—茎叶图】
12、(顺序问题易错选C)如图,甲乙两名篮球运动员每场比赛得分情况的茎叶图,则甲和乙得分的中位数的和是()
A、56 B、57 C、58 D、59
13、(分类讨论)某校开展“爱我德州、爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示。记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是。
三、变量的相关性
小题考点:(1)回归直线方程过(x,y)(2)回归系数的含义:符号和绝对值
【典型例题--基本概念】
1、在下列各图中,每个图的两个变量具有相关关系的图是( )
5 / 12