(2)、平均数
30000?20000?3500?2?3000?2500?5?2000?3?1500?20 33?3288(元)x?中位数为1500元,众数是1500元。 (3)、在此问题上,中位数和众数均能反映该公司员工的工资水平,因为该公司少数人的工资额与大多数人的工资额差距太大,故平均数不能反映该公司员工的工资水平。 题型2:用样本数据的平均数、方差估计总体的分布
[例4]、甲乙两台机床在相同的条件下同时生产一种零件,现在从中各抽测10个,它们的尺寸分别为(单位:mm)
甲: 10.2 10.1 10.9 8.9 9.9 10.3 9.7 10 9.9 10.1 乙: 10.3 10.4 9.6 9.9 10.1 10 9.8 9.7 10.2 10
分别计算上面两个样本的平均数与方差.如果图纸上的设计尺寸为10mm,从计算结果看,用哪台机床加工这种零件较合适
1解:x甲?1(10.2+10.1+10.9+?+10.1)=10 x乙?(10.3?10.4?9.6???10)?10
101011222[(10.2-10)+(10.1-10)+?S乙?[(10.3?10)2?(10.4?10)2 10102+(10.1-10)]=0.228???(10?10)2]?0.062S甲?22 所以乙比甲稳定,用乙较合适。 ?x甲?x乙?10,S甲?S乙【反思归纳】从数字特征上描述一组数据的情况:平均数、众数、中位数描述其集中趋势,方
差、标准差反映了样本数据与其平均数的离散程度一组数据的方差或标准差越大,说明这组数据波动越大,方差的单位是原数据的单位的平方,标准差的单位与原数据的单位相同。 (二)、强化巩固训练 1、观察下面的频率分布表
分组 频数 频率 [3.95,4.35) 2 [4.35,4.75) 4 [4.75,5.15) 14 [5.15,5.55) 25 [5.55,5.95) 45 [5.95,6.35) 46 [6.35,6.75) 39 [6.75,7.15) 20 [7.15,7.55) 4 [7.55,7.95) 1 合计 200 (1) 完成上面的频率分布表; (2) 根据上表,画出频率分布直方图; (3) 根据表和图估计数
据落在[4.75,7.15)范围内的概率约是多少?数据小于7.00的概率约是多少?
解:(1) (略) (2)频率直方图(略) (3)根据上面的表和图可以估计,数据落在[4.75,7.15)内的概率约为0.945,数据小于7.00的概率约为0.9375。
2、对甲乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下: 甲:60 80 70 90 70 乙:80 60 70 80 75
16
问:甲乙谁的各科平均成绩好?谁的各门功课发展较平衡?
2222解:x甲?74 x乙?73 S甲。所以甲的平均成绩较?104 S乙?56 因为x甲?x乙,S甲?S乙好,乙的各门发展较平衡。 (三)、小结反思:1、注意以下几个概念的区别与联系:频数、频率、概率。2、频率分布条形图是用高度来表示概率的,而概率分布直方图是用面积来表示概率的。3、统计内容的实践性较强,其重点是如何用样本频率分布去估计总体分布,难点是对频率分布直方图的理解和应用。方差是反映稳定性程度的一个重要特征,在日常生活中常有体现,如两同学的总成绩都一样,但是一个人有偏科现象,而另一个人没有,一般认为没有偏科现象(即方差小)的同学成绩要稳定一些。⑴、列频率分布表步骤:①计算极差;②决定组距和组数(数据在50—100个,分组一般在5—12组);④决定分点;④列频率分布表.茎叶图便于表示两位有效数字的数据。⑵、 频率分布直方图的特点:①纵轴表示
频率;②矩形的面积表示率,各矩形的面积和为1。做到读组距懂图,会画图.掌握作图的步骤.频率分布图的优点是它反映了数据的变化趋势.总体分布反映是总体在各个范围内取值的比例情况,而这种分布一般是不知道的,所以用样本的分布估计总体分布,因而样本数据的代表性就很重要。⑶、平均数:平均数描述数据的平均水平,定量地反映数据集中趋势处的水平,用样本平均数估计总体平均数时,样本平均数只是总体平均数的近似值。⑷、从数字特征上描述一组数据的情况:平均数、众数、中位数描述其集中趋势,方差、标准差反映了样本数据与其平均数的离散程度一组数据的方差或标准差越大,说明这组数据波动越大,方差的单位是原数据的单位的平方,标准差的单位与原数据的单位相同。 (四)、作业布置:限时训练21中12、14
课外练习:限时训练21中1、3、4、6、7、9、10、11、13
五、教学反思:
17
第五课时 相关性与最小乘估计
一、复习目标:1、会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系。2、了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆)。
二、重难点及学法指导:1、相关关系的理解:(1)相关关系是非随机变量与随机变量之间的关系,而函数关系则是两个非随机变量之间的关系,虽然两者均是指两个变量之间的关系,但不能把相关关系等同于函数关系。(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系。2.两个变量的线性相关:(1)对已知双曲线方程,则渐近线方程确定。具有相关关系的两个变量进行统计的方法叫回归分析。回归分析是寻找相关关系中非确定性关系的某种确定性。(2)将n个数据点(xi,yi)(i?1,2,......n)描在平面直角坐标系中,以表示具有相关关系的两个变量的一组数据的图形叫做散点图。散点图形像地反映了各数据的密切程度。3、两个变量的相关关系分析:可根据样本数据散点图确定两个变量之间是否存在相关关系,然后利用最小二乘法求出回归直线方程。 三、教学方法:讲练结合,探析归纳。 四、教学过程 (一)、谈新考纲要求及高考命题考查情况,促使积极参与。
1、新考纲要求:⑴、会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系。⑵、了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆)。 2、高考命题考查情况简析及预测:(1)概率统计试题的题量大致为2道,约占全卷总分的6%-10%,试题的难度为中等或中等偏易。(2)概率统计试题通常是通过对课本原题进行改编,通过对基础知识的重新组合、变式和拓展,从而加工为立意高、情境新、设问巧、并赋予时代气息、贴近学生实际的问题。这样的试题体现了数学试卷新的设计理念,尊重不同考生群体思维的差异,贴近考生的实际,体现了人文教育的精神。 (二)、知识梳理整合,方法定位(学生完成复资P54填空题,教师针对问题讲评) 1、线性回归:
(1) 相关关系或回归关系:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。注:与函数关系不同,相关关系是一种非确定性关系。 (2)回归分析:对具有相关关系的两个变量进行统计分析的方法。 (3)散点图:表示具有相关关系的两个变量的一组数据的图形。
⑷回归直线方程:设x与y是具有相关关系的两个变量,且相应于n个观测值的n个点大致分
??a?bx。其中布在某一条直线的附近,就可以认为y对x的回归函数的类型为直线型:yb??(xi?1nni?x)(yi?y)?i?xyii?1nni?nxy?nx2,a?y?bx。我们称这个方程为y对x的回归直线;相应
?(xi?1?x)2?xi?12i的直线叫回归直线,对两个变量所进行的上述统计叫做线性回归分析。
2、研究两个变量间的相关关系是学习本节的目的。对于相关关系我们可以从下三个方面加以认识:(1)相关关系与函数关系不同。函数关系中的两个变量间是一种确定性关系。例如正方形
2面积S与边长x之间的关系S?x就是函数关系。即对于边长x的每一个确定的值,都有面积
S的惟一确定的值与之对应。相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系。例如人的身高与年龄;商品的销售额与广告费等等都是相关关系。(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系。例如有人发现,对
18
于在校儿童,身高与阅读技能有很强的相关关系。然而学会新词并不能使儿童马上长高,而是涉及到第三个因素——年龄,当儿童长大一些,他们的阅读能力会提高而且由于长大身高也会高些。(3)函数关系与相关关系之间有着密切联系,在一定的条件下可以相互转化。例如正方形面积S与其边长x间虽然是一种确定性关系,但在每次测量边长时,由于测量误差等原因,其数值大小又表现出一种随机性。而对于具有线性关系的两个变量来说,当求得其回归直线后,我们又可以用一种确定性的关系对这两个变量间的关系进行估计。 (三)、基础巩固训练
1、下列关系中,是相关关系的为( )。
①学生的学习态度与学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系; ③学生的身高与学生的学习成绩之间的关系;④家庭的经济条件与学生的学习成绩之间的关系。 ?A.①②? B.①③? C.②③? D.②④? 答案?A??
2、为了考察两个变量x、y之间的线性相关关系,甲、乙两同学各自独立地做10次和15次试验,并利用最小二乘法求得回归直线分别为l1和l2.已知在两人的试验中发现变量x的观测数据的平均值恰好相等,都为s,变量y的观测数据的平均值也恰好相等,都为t,那么下列说法中正确的是 ( )。
A.直线l1,l2有交点(s,t) B.直线l1,l2相交,但是交点未必是(s,t) C.直线l1,l2由于斜率相等,所以必定平行 D.直线l1,l2必定重合 答案 A
3、下列有关线性回归的说法,不正确的是 ( )。
A.相关关系的两个变量不一定是因果关系 B.散点图能直观地反映数据的相关程度 C.回归直线最能代表线性相关的两个变量之间的关系 D.任一组数据都有回归直线方程 答案 D
4、下列命题:①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归直线
y?bx?a及回归系数b,可以估计和预测变量的取值和变化趋势。其中正确的命题是
( )。
A.①②? B.①③? 答案?D??
?? C.②③? D.①②③?
5、已知线性回归方程为答案 11.69
yy?0.50x?0.18,则x?25时,的估计值为 。
?^y6、某工厂某产品产量x(千件)与单位成本y(元)满足回归直线方程?77.36?1.82x,则
以下说法中正确的是( )。 答案: A
A.产量每增加1000件,单位成本下降1.82元 B.产量每减少1000件,单位成本上升1.82元 C.产量每增加1000件,单位成本上升1.82元 D.产量每减少1000件,单位成本下降1.82元
^y7、工人月工资(元)依劳动生产率(千元)变化的回归方程为?60?90x,下列判断正确
的是( )。 答案:C
A.劳动生产率为1000元时,工资为150元 B.劳动生产率提高1000元时,工资提高150元 C.劳动生产率提高1000元时,工资提高90元 D.劳动生产率为1000元时,工资为90元。
19
8、三点(3,10),(7,20),(11,24)线性的回归方程是 ( )。 A.y??5.75?1.75x C.y??1.75x?5.75
??
B.y?1.75x?5.75? D.y??1.75x?5.75?
??答案?B??
9、某人对一地区人均工资x(千元)与该地区人均消费y(千元)进行统计调查,y与x有相关关系,得到回归直线方程y?0.66x?1.562.若该地区的人均消费水平为7.675千元,估计该地区的人均消费额占人均工资收入的百分比约为( )。
?A.66%? B.72%?? C.67%? ?D.83%?? 答案?D?? 10、某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值,计算,得?x=52, ?y=228, ?x=478, ?xy=1 849,则其线性回归方程为( )。
2i?1
i
i?1
i
i?1i8
8
8?8i?1iiA.y?2.62x?11.47? C.y?2.62?11.47x
??
B.y?2.62x?11.47?
?? D.y??2.62x?11.47?
答案?A?? (四)、小结反思:研究两个变量间的相关关系是学习本课的目的。对于相关关系我们可以从下三个方面加以认识:(1)相关关系与函数关系不同。函数关系中的两个变量间是一种确定性关系。例如正方形面积S与边长x之间的关系S?x2就是函数关系。即对于边长x的每一个确定的值,都有面积S的惟一确定的值与之对应。相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系。例如人的身高与年龄;商品的销售额与广告费等等都是相关关系。(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系。例如有人发现,对于在校儿童,身高与阅读技能有很强的相关关系。然而学会新词并不能使儿童马上长高,而是涉及到第三个因素——年龄,当儿童长大一些,他们的阅读能力会提高而且由于长大身高也会高些。(3)函数关系与相关关系之间有着密切联系,在一定的条件下可以相互转化。例如正方形面积S与其边长x间虽然是一种确定性关系,但在每次测量边长时,由于测量误差等原因,其数值大小又表现出一种随机性。而对于具有线性关系的两个变量来说,当求得其回归直线后,我们又可以用一种确定性的关系对这两个变量间的关系进行估计。 (五)、作业布置:课本P70A组中8 B组中3、4、5
课外练习:复资1、2、3 随堂训练中2、3、4、5、6
五、教学反思:
20