1
第88题 频率分布直方图
I.题源探究·黄金母题
【例1】若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是 ( )
精彩解读
【试题来源】例1:人教A版必修3P70改编;例2:人教A版必修3P65例题改编.
【母题评析】这类题主要考查平
A.91.5和91.5 B.91.5和92 C.91和91.5 D.92和92 【答案】A
均数、方差的计算以及茎叶图与频率分布直方图的简单应用. 【思路方法】用样本估计总体是统计的基本方法:
(1)最高的矩形的中点横坐标即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个
【例2】如图是某城市100位居民去年的月均用水量(单位:t)的频率分布直方图,月均用水量在区间?1.5,2.5?的居民大约有 ( )
小矩形的面积乘以小矩形底边中点的横坐标之和.
A.37位 B.40位 C.47位 D.52位 【答案】C
【解析】由频率分布直方图月均用水量在区间?1.5,2?的频率为
0.45?0.5?0.225,月均用水量在区间?2,2.5?的居民的频率 为0.50?0.5?0.25.月均用水量在区间?1.5,2.5?的居民的频数大约为
2
1
?0.225?0.25??100?47,故选C.
II.考场精彩·真题回放
【例1】【2017高考新课标3理3】某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.
【命题意图】这类重点题考查分层抽样和系统抽样的计算.考查考生基本计算能力.
【考试方向】这类试题在考查题型上,主要以选择题或填空题为主,属于中低档题. 【难点中心】
1.将频率分布直方图中相邻的矩
根据该折线图,下列结论错误的是 A.月接待游客量逐月增加 B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳 【答案】A
形的上底边的中点顺次连结起来,就得到一条折线,我们称这条折线为本组数据的频率折线图,频率分布折线图的的首、尾两端取值区间两端点须分别向外延伸半个组距,即折线图是频率分布直方图的近似,他们比频率分布表更直观、形象地反映了样本的分布规律.
2.分清几个样本特征数: 众数:一组数据出现次数最多的数叫众数,众数反应一组数据的多数水平;中位数:一组数据中间的数,(起到分水岭的作用)中
客量波动性大,D选项正确.故选A.
【例2】【2017高考新课标1文2】为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是 A.x1,x2,…,xn的平均数 C.x1,x2,…,xn的最大值
B.x1,x2,…,xn的标准差 D.x1,x2,…,xn的中位数
位数反应一组数据的中间水平;平均数:反应一组数据的平均水平;方差:方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方
2
1
【答案】B
【解析】刻画评估这种农作物亩产量稳定程度的指标是标准差,故选B. 【例3】【2017高考山东文8】如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为
A. 3,5 B. 5,5 C. 3,7 D. 5,7
差.在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.标准差是方差的算术平方根,意义在于反映一个数据集的离散程度.
3.用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法.分布表在数量表
【答案】A
示上比较准确,直方图比较直观. 4.频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积
得x?3.故选A.
【例4】【2017高考北京文17】某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),┄,[80,90],并整理得到如下频率分布直方图:
的和等于1.
(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
2
1
(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(Ⅲ)已知样本中有一半男生的分数学不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例. 【答案】(Ⅰ)0.4;(Ⅱ)20;(Ⅲ)3:2.
(Ⅱ)根据题意,样本中分数不小于50的频率为
(0.01?0.02?0.04?0.02)?10?0.9,分数在区间[40,50)内的人数为
100?100?0.9?5?5.
所以总体中分数在区间[40,50)内的人数估计为400?5?20. 100(Ⅲ)由题意可知,样本中分数不小于70的学生人数为
(0.02?0.04)?10?100?60,
所以样本中分数不小于70的男生人数为60?1?30. 2所以样本中的男生人数为30?2?60,女生人数为100?60?40,男生和女生人数的比例为60:40?3:2.
所以根据分层抽样原理,总体中男生和女生人数的比例估计为3:2.
III.理论基础·解题原理
⑴一表二图:
①频率分布表——数据详实 ②频率分布直方图——分布直观
③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1. ⑵茎叶图:
①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等. ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写. 3.总体特征数的估计: 2
1
⑴平均数:x?x1?x2?x3???xn;取值为x1,x2,?,xn的频率分别为p1,p2,?,pn,则其平均数为
nx1p1?x2p2???xnpn;注意:频率分布表计算平均数要取组中值.
1⑵方差与标准差:一组样本数据x1,x2,?,xn方差:s2?n?(xi?1n2i?x);标准差:s?1n?(xi?1n2i?x)
注:方差与标准差越小,说明样本数据越稳定.平均数反映数据总体水平;方差与标准差反映数据的稳定水平.
IV.题型攻略·深度挖掘
【考试方向】
这类试题在考查题型上,通常以选择题或填空题的形式出现,难度中等. 【技能方法】
1.解题模板:第一步,根据频率分布直方图计算出相应的频率;第二步,运用样本的频率估计总体的频率;第三步,得出结论.
2.用样本估计总体是统计的基本思想.
用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.
3.(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质.
(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大. 4.茎叶图、频率分布表和频率分布直方图都可直观描述样本数据的分布规律. 【易错指导】
1.在使用茎叶图时,一定要注意看清楚所有的样本数据,弄清楚这个图中的数字特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.
2.利用频率分布直方图求众数、中位数与平均数时,应注意这三者的区分:(1)最高的矩形的中点横坐标即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
3.直方图与条形图不要搞混
频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.
V.举一反三·触类旁通
考向1 茎叶图及其应用
【例1】【2018黑龙江齐齐哈尔高三第一次模】某校连续12天对同学们的着装进行检查,着装不合格的人数
2