[考点精要]
1.有关数据的数字特征
2.众数、中位数、平均数的异同
(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量. (2)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会相应引起平均数的变动.
(3)众数考查各数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,众数往往更能反映问题.
(4)中位数仅与数据的大小排列顺序有关,某些数据的变动可能对中位数没有影响,中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.
[典例] (1)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )
A.甲的成绩的平均数小于乙的成绩的平均数 B.甲的成绩的中位数等于乙的成绩的中位数 C.甲的成绩的方差小于乙的成绩的方差 D.甲的成绩的极差小于乙的成绩的极差
(2)由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于
6
1,则这组数据为________.(从小到大排列)
[解析] (1)由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A错;甲、乙的成绩的中位数分别为6,5,B错;甲、乙的成绩的方112222222
差分别为×[(4-6)+(5-6)+(6-6)+(7-6)+(8-6)]=2,×[(5-6)+(5-6)
5512222
+(5-6)+(6-6)+(9-6)]=,C对;甲、乙的成绩的极差均为4,D错.故选C.
5
??4
(2)假设这组数据按从小到大的顺序排列为x,x,x,x,则?x+x??2=2,
1
2
3
4
2
3
x1+x2+x3+x4
=2,
??x1+x4=4,
∴?
?x2+x3=4,?
1
4
又s= ==1212
x1-
2
2
+x2-
2
2
+x3-
2
2
+x4-
2
2
]
x1-x1-
2
+
2x2-+x3-
2+x4-
+x2-
2
]=1,
∴(x1-2)+(x2-2)=2. 同理可求得(x3-2)+(x4-2)=2.
由x1,x2,x3,x4均为正整数,且(x1,x2),(x3,x4)均为圆(x-2)+(y-2)=2上的点,分析知x1,x2,x3,x4应为1,1,3,3.
[答案] (1)C (2)1,1,3,3 [类题通法]
平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.
[题组训练]
1.(山东高考)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:
①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( )
7
2
2
2
2
A.①③ C.②③
解析:选B 法一:∵x甲=
B.①④ D.②④
26+28+29+31+31
=29,
5
x乙=
28+29+30+31+32
=30,
5
∴x甲 9+1+0+4+41824+1+0+1+42 又s甲==,s乙==2, 555∴s甲>s乙.故可判断结论①④正确. 法二:甲地该月14时的气温数据分布在26和31之间,且数据波动较大,而乙地该月14时的气温数据分布在28和32之间,且数据波动较小,可以判断结论①④正确,故选B. 2.甲和乙两个城市去年上半年每月的平均气温(单位:℃)用茎叶图记录如图所示,根据茎叶图可知,两城市中平均温度较高的城市是__________,气温波动较大的城市是__________. 解析:根据题中所给的茎叶图可知,甲城市上半年的平均温度 9+13+17×2+18+2212+14+17+20+24+27 为=16,乙城市上半年的平均温度为=19, 66故两城市中平均温度较高的是乙城市,观察茎叶图可知,甲城市的温度更加集中在峰值附近,故乙城市的温度波动较大. 答案:乙 乙 3.甲、乙两台机床同时加工直径为100 mm的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位:mm): 甲:99,100,98,100,100,103; 乙:99,100,102,99,100,100. (1)分别计算上述两组数据的平均数和方差; (2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求. 解:(1)x甲= 99+100+98+100+100+103 =100(mm), 6 x乙= 16 99+100+102+99+100+100 =100(mm), 6 22222 s2甲=[(99-100)+(100-100)+(98-100)+(100-100)+(100-100)+(103- 722 100)]=(mm), 3 8 22222 s2乙=[(99-100)+(100-100)+(102-100)+(99-100)+(100-100)+(100- 1 6 100)]=1(mm). (2)因为s甲>s乙,说明甲机床加工零件波动比较大,因此乙机床加工零件更符合要求. 线性回归 主要考查线性相关关系的判断,回归方程的求法以及利用回归分析解决实际问题.考查形式为选择题、填空题、解答题,属于中低档题. [考点精要] 1.两个变量的线性相关 (1)散点图:将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中得到的图形. (2)正相关与负相关: ①正相关:散点图中的点散布在从左下角到右上角的区域. ②负相关:散点图中的点散布在从左上角到右下角的区域. 2.回归直线的方程 (1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. (2)线性回归方程: ^^^ 方程y=bx+a是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn, 2 2 22 yn)的线性回归方程,其中a,b是待定参数. ?? x-xy-y?^b=?? x-x?^ ?a=y-b x. niii=1 n2 n?xiyi-n x yi=1 =n2 i-n x?x2 ,i=1 ii=1 8.8 75 [典例] 某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据: 单价x(元) 销量y(件) 8 90 8.2 84 8.4 83 8.6 80 9 68 ^^^^^^(1)求回归直线方程y=bx+a,其中b=-20,a=y-bx; 9 (2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本) 11 [解] (1)由于x=(8+8.2+8.4+8.6+8.8+9)=8.5,y=(90+84+83+80+75 66+68)=80. ^^^ 所以a=y-bx=80+20×8.5=250,从而回归直线方程为y=-20x+250. (2)设工厂获得的利润为L元,依题意得 L=x(-20x+250)-4(-20x+250) =-20x+330x-1 000 =-20(x-8.25)+361.25. 当且仅当x=8.25时,L取得最大值. 故当单价定为8.25元时,工厂可获得最大利润. [类题通法] (1)线性回归分析就是研究两组变量间线性相关关系的一种方法,通过对统计数据的分析,可以预测可能的结果,这就是线性回归方程的基本应用,因此利用最小二乘法求线性回归方程是关键,必须熟练掌握线性回归方程中两个重要估计量的计算. (2)回归直线方程恒过点(x,y). [题组训练] 某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料: 日期 昼夜温 差x(℃) 就诊人数 1月 10日 10 2月 10日 11 3月 10日 13 4月 10日 12 5月 10日 8 6月 10日 6 2 2 y(人) 22 25 29 26 16 12 该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验. (1)求选取的2组数据恰好是相邻两个月的概率; (2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y关于x的线^^^性回归方程y=bx+a; (3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想? 10