⑵中位数:将一组数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数;如果数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数.——唯一且带有单位. 中位数作为一组数据的代表,可靠性比较差,因为它只利用了部分数据.但当一组数据的个别数据偏大或偏小时,用中位数来描述该组数据的集中趋势就比较合适. 中位数与数据的排列位置有关,而某些数据的变动对它没有影响;它是一组数据中间位置上的代表值,不易受数据极端值的影响. 中位数像一条分界线,将数据分成前半部分和后半部分,因此用来代表一组数据的“中等水平”.中位数是一个不完全“虚拟”的数.当一组数据有奇数个时,它就是该组数据排序后最中间的那个数据,是这组数据中真实存在的一个数据;但在数据个数为偶数的情况下,中位数是最中间两个数据的平均数,它不一定与这组数据中的某个数据相等,此时的中位数就是一个虚拟的数. 中位数意义:若一组数据中的中位数是a,则说明大于或小于a的数各占一半. ⑶众数:在一组数据中,出现次数最多的数(有时不止一个),叫做这组数据的众数. 众数作为一组数据的代表,可靠性也比较差,因为它也只利用了部分数据。在一组数据中,如果个别数据有很大的变动,且某个数据出现的次数最多,此时用该数据(即众数)表示这组数据的“集中趋势”就比较适合. 众数与数据出现的次数有关,着眼于对各数据出现的频率的考察,其大小只与这组数据中的部分数据有关,众数是一组数据中出现次数最多的数据,而不是该数据出现的次数,一组数据中的众数不唯一,可以有多个,也可以没有众数,但不能说众数是零.——带单位 众数不受极端值的影响,其缺点是具有不惟一性,反映了出现次数最多的数据,用来代表一组数据的“多数水平”.是一组数据中的原数据 ,它是真实存在. 例6:已知一组数据的中位数为80,可知这组数据中大于或小于这个中位数的数据各占 ,中位数有 个。 【分析】中位数是一个位置代表值,可以笼统理解为处于中间位置的数据,这个数据可以是现成的数,也可以是中间两个数的平均值。小于和大于它们中位数的数据各占一半,中位数只有唯一一个.
例7:周三下午体锻课有六个学生进行投篮比赛,投进的个数分别为2,3,3,5,7,10,13,?则这七个数的中位数是 ,众数是 .
【分析】找出中位数的前提是这组数据已经排好了顺序,这组数据的个数是7个,那么中位数就是处于第4个位置的数:5.而这组数据出现次数最多的数是3,所以众数是3.
例8:下图是某市排球队队员年龄结构直方图,根据图中信息解答下列问题:(1)该队队员年龄的平均数;(2)该队队员年龄的众数和中位数.
17?1?18?2?21?3?23?2?24?2【分析】平均数为?21. 21岁的人数最多,故众数为21.
1?2?3?2?2由于共有10个数据,第5、第6个数据的平均值为中位数,即
21?21?21. 22、数据的波动(表示一组数据的离散程度)
⑴极差:是指一组数据中最大数据与最小数据的差叫做这组数据的极差.【极差=数据中的最大值—数据中的最小值.】——极差反映的是一组数据的稳定性即波动大小 ①极差是刻画数据离散程度(波动情况)的最简单的统计量,能够反映数据的变化范围.(由于极差仅是由两个数据来评判一组数据的,但不能反映出中间数据的分散状况,故不科学) ②为了体现一组数据的离散程度,我们常用这组数据中最大值与最小值的差来反映这组数据的变化范围,这样的差叫做极差。一组数据,极差大,离散程度就大;极差小,离散程度就小;所以离散程度的大小与极差的大小是成正比的。 ③我们通常用数据的离散程度来描述一组数据的波动范围和偏离平均数的差异程度.数据的离散程度越大,表示数据分布的范围越广,越不稳定,平均数的代表 性也就越小;数据的离散程度越小,表示数据分布的范围越集中,变动范围越小,平均数的代表性就越大. ⑵方差:在一组数据x1,x2,,x3,?,xn中,各数据与他们的平均数x的差的平方的平均数,叫做这组数据的方差,
2常用S来表示,即:S?1[(x1?x)2?(x2?x)2???(xn?x)2]; n2方差是各个数据与平均数之差的平方的平均数,记作s.【用“先平均,再求差,然后平方,最后再平2均”得到的结果表示一组数据偏离平均值的情况,这个结果叫方差】 方差是一个非负数,其单位是原始数据单位的平方,但通常省略.用来描述一组数据在它的平均数附近的波动情况(稳定性),方差越大,说明这组数据的波动就大,方差越小,波动就越小. 方差的作用:用于表述一组数据波动的大小,方差越小,该数据波动越小,越稳定或整. 方差的三种公式: 1[(x1?x)2?(x2?x)2???(xn?x)2];n122222②化简公式:S?[(x1?x2??xn)?nx] n122222③化简公式的变形公式:S?(x1?x2??xn)?x n⑶ 标准差:方差的算术平方根,记作S.
①基本公式:S?2 方差与标准差的关系:①??s2;②?与s2的作用相同、单位不同。 1?x1?x?2??x2?x?2???xn?x?2; n①方差的算数平方根?叫做这组数据的标准差,即:??②标准差用于描述一组数据波动的大小; ③标准差的单位与原数据的单位相同; ??例9:下图是一组数据的折线统计图,这组数据的极差是 . 【分析】一组数据中最大数据与最小数据之差叫极差,由图可知, 这组数据中最大数据59与最小数据28之差为31,故极差为31.
例10:(1)数据 -1,0,1,2,3的方差是 .(2)数据5,5,5,5,5的方差是 .
(x1?x)2?(x2?x)2????(xn?x)2【分析】本题考查方差的计算,让学生熟悉方差的计算公式S?
n将数据代入公式可得:(1)2;(2)0.可以让学生思考一下方差为0的实际意义 例11:一组数据的方差一定是( )
A. 正数 B. 任意实数 C. 负数 D. 非负数
2例12:在方差公式S2?221x1?x?x2?x???xn?xn????????中,下列说法不正确的是( )
2 A. n是样本的容量 B. xn是样本个体 C. x是样本平均数 D. S是样本方差
【分析】解剖方差公式,了解公式里面每一个代数代表的意义.D选项是错误的.
例13:体育课上,初二(1)班的两个小组各8人参加400米跑,要判断哪一组成绩比较整齐,通常需要知道这两个小组400米跑成绩的( )
A.平均数 B.众数 C.方差 D.频率分布
例14:已知一个样本:1,3,5,x,2,它的平均数为3,则这个样本的方差是 .
1?3?5?x?2【分析】本题通过一组数据综合考察平均数和方差的定义.由平均数的定义可得:?3,解得
5(1?3)2?(3?3)2?(5?3)2?(4?3)2?(2?3)2x?4,则这组数据的方差为:S??2
5例15:从一排摆有200个苹果的架子上抽测了10个苹果的重量,将测得的每一个数据(单位:g)都减去100g,其结果如下:-8,2,-6,10,3,-7,5,2,-6,0; (1)这10个苹果中最重的与最轻的之差是 ;
(2)这10个苹果的平均重量为 ;方差为 . (3)求这一排苹果的重量.
【分析】这道题综合考察了极差、平均数、方差的计算和用样本估计总体的思想.可以让学生认识这些统计量和统计方法的实际意义.
(1)由所提供的数据,最大值为10,最小值为-8,故最重与最轻的苹果之差为10-(-8)?18(g)
?8?2?(?6)?10?3?(?7)?5?2?(?6)?0(2)这10个数据的平均值??0.5.则这10个苹果的平均重
10(?8?0.5)2?(2?0.5)2?(?6?0.5)2????(0?0.5)22量为 100+(-0.5)?99.5(g)方差为S??32.45
10200(3)由于抽测的10个苹果的平均值为99.5g,因此可以估计这排苹果的重量为:?99.5?1990(g).
10例16:某公司销售部有16名营销人员,销售部为了制定某种商品的月销售定额,统计了这16人某月的销售量如下:
每人销售件数 1000 500 400 300 200 100 人 数 1 1 2 4 5 3 (1)在这16名营销人员中,销售件数在多少件的人数最多?中间的销售件数是多少?销售的平均件数是多少? (2)假设销售部要制定一个较高的销售定额,你认为应该定为多少合适?说明理由. (3)为了调动营销人员的积极性,销售部想让一半左右的人员达到目标,你认为销售定额应该定为多少合适?说明理由.
(4)假设销售部把每位营销人员的月销售量定为320件,你认为是否合理?为什么?
【分析】这是一道关于平均数、中位数、众数的综合练习,主要考察这些统计量的实际意义.
(1)这一组数据的众数是200,中位数是250,平均数是300,所以销售件数在200件的人数最多;中间的销售件数是250件;销售的平均件数是300件.
1(2)从数据上看,在平均数、众数、中位数中,平均数最大,如果把300件定为一个较高目标,有的销售人
421员能够超过这个标准,有的销售人员已经达到奖励标准。故定位300件合适.(3)月销售量在250件以上的
41有8个人,占总人数的,这样可以充分调动销售人员积极性,故定位250件合适.(4)因为16个人里面只有
234个人的销售量达到320件以上,有的销售人员达不到要求,故将销售量定为320件是不合理.
4易错点归纳
★ ① 忽略了加权平均数中“权“的存在
1、有8个数的平均数是10,还有12个数的平均数是12,则这20个数的平均数是 . 【正解】x?10?8?12?12?11.2. 这20个数的平均数是11.2.
20★ ② 忽略了将中位数进行排序 2、学校8名学生三月份参加义务劳动的时间(小时)分别为3,6,4,3,7,5,7,4,这组数据的中位数是 . 【错解】观察数据可得,中位数为第4、第5个位置的数据的平均数,即3?7?5
2【正解】先将数据进行排序:3,3,4,4,5,6,7,7,因此中位数为4?5?4.5
2★ ③ 忽略了数据的个数
3、广州某地连续10天的最高气温统计如下:
最高气温(oC) 22 23 24 25 26 这组数据的中位数是 .
【错解】由图表可得5个温度:22、23、24、25、26,中间位置的数为天数 1 24,所以中位数为2 2 4 24. 1 【正解】图表中22、23、24、25、26只是属于最高温度的类型,需要讨论的数据其实有10个:22、23、23、24、24、25、25、25、25、26,因此这组数据的中位数是24?25?24.5
2★ ④ 忽略了众数的个数
4、若数据8,7,8,x,5的平均数是7,则这组数据的众数是 .【正解】由题意可得
8?7?8?x?5?7,
5所以,x?7,故这组数据的众数为7、8.
★ ⑤ 用样本估计总体时,错把样本的统计量当做总体的统计量
5、为发展农业经济,养鸡大户王大伯2010年养了2000只鸡。上市前他随机抽取了10只鸡,称得质量统计如下表:估计这批鸡的总质量是 千克 质量(单位 kg) 数量(单位 只) 【错解】
2 1 2.2 2 2.5 4 2.8 2 3 1 2?1?2.2?2?2.5?4?2.8?2?3?1,2.5×10?25(kg).这批鸡的总质量是25千克 ?2.5(kg)
10【正解】2.5×2000 ?5000(kg).这批鸡的总质量是5000千克