第六课时 相关性与最小乘估计
——热点考点题型探析
一、复习目标:1、会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系。2、了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆)。
二、重难点及学法指导:1、相关关系的理解:(1)相关关系是非随机变量与随机变量之间的关系,而函数关系则是两个非随机变量之间的关系,虽然两者均是指两个变量之间的关系,但不能把相关关系等同于函数关系。(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系。2.两个变量的线性相关:(1)对已知双曲线方程,则渐近线方程确定。具有相关关系的两个变量进行统计的方法叫回归分析。回归分析是寻找相关关系中非确定性关系的某种确定性。(2)将n个数据点(xi,yi)(i?1,2,......n)描在平面直角坐标系中,以表示具有相关关系的两个变量的一组数据的图形叫做散点图。散点图形像地反映了各数据的密切程度。3、两个变量的相关关系分析:可根据样本数据散点图确定两个变量之间是否存在相关关系,然后利用最小二乘法求出回归直线方程。 三、教学方法:讲练结合,探析归纳。 四、教学过程 (一)、热点考点题型探析
考点1:两个变量间的相关关系
题型:两个变量间的相关关系的判断
【例1】有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系.其中,具有相关关系的是 。 答案 ①③④
【反思归纳】相关关系是非随机变量与随机变量之间的关系,而函数关系则是两个非随机变量之间的关系,虽然两者均是指两个变量之间的关系,但不能把相关关系等同于函数关系。函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系。 考点2:散点图及其应用
题型:绘制散点图和由散点图判断两个变量间的线性相关关系
【例2】以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:
房屋面积x(m) 销售价格y(万元) 2115 24.8 110 21.6 80 18.4 135 29.2 105 22 (1)画出数据对应的散点图;
(2)求线性回归方程,并在散点图中加上回归直线。 解:(1)数据对应的散点图如图所示:
(2)x=109,y=23.2,?x=60 975, ?xy=12 952,
2i?1i55i?1iib=
?i?15i?15xiyi?5xy≈0.196 2 a=y-bx≈1.814 2
xi2?5x2?
21
∴所求回归直线方程为y?0.1962x?1.8142。
【反思归纳】在考虑两个变量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,此图称为变量之间的散点图。利用散点图的分布特点,可判断两个变量之间是否具有相关关系。若点分布在某条直线周围,则两个变量是线性相关的;若点在某曲线(非直线)附近波动,则此相关是非线性相关的;若所有点在散点图中没有显示任何关系,则变量之间是不相关的。 考点3:线性回归方程 题型:求线性回归方程
【例3】某公司利润y与销售总额x(单位:千万元)之间有如下对应数据: x y 10 1 15 1.3 17 1.8 20 2 25 2.6 28 2.7 32 3.3 ?(1)画出散点图;(2)求线性回归线方程;(3)估计销售总额为24千万元时的利润。 解 (1)散点图如图所示:
(2)x=(10+15+17+20+25+28+32)=21, y=(1+1.3+1.8+2+2.6+2.7+3.3)=2.1,
?x=10+15+17+20+25+28+32=3 447,
2i?1i717172222222
?xy=10×1+15×1.3+17×1.8+20×2+25×2.6+28×2.7+32×3.3=346.3,
i?1ii7b=
?i?17i?17xiyi?7xy=
xi2?7x2346.3?7?21?2.13447?7?212≈0.104, a=y-bx=2.1-0.104×21=-0.084,
??∴y?0.104x?0.084
(3)把x=24(千万元)代入方程得,y?2.412(千万元)。∴估计销售总额为24千万元时,利润为2.412千万元。 【反思归纳】求回归直线方程,关键在于正确求出系数a,b,由于计算量大,所以计算时要仔细谨慎,分层进行,避免因计算产生失误,特别注意,只有在散点图大体呈线性时,求出的回归直线方程才有意义。利用回归方程可以估计总体,回归直线方程将部分观测值所反映的规律进行延伸,是我们对有线性相关关系的两个变量进行分析和控制,依据自变量的取值估计和预报因变量值的基础和依据,有广泛的应用。 (二)、强化巩固训练
1、期中考试结束后,记录了5名同学的数学和物理成绩,如下表:
? 22
学生 学科 数学 物理 A 80 70 B 75 66 C 70 68 D 65 64 E 60 62 (1)数学成绩和物理成绩具有相关关系吗? (2)请你画出两科成绩的散点图,结合散点图,认识(1)的结论的特点。 解 (1)数学成绩和物理成绩具有相关关系。
(2)以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图如下:
由散点图可以看出,物理成绩和数学成绩对应的点不分散,大致分布在一条直线附近。 2、某种产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据:
x y 2 30 4 40 5 60 6 50 8 70 (1)画出散点图; (2)求线性回归方程;(3)试预测广告费支出为10百万元时,销售额多大?
解 (1)根据表中所列数据可得散点图如下:
(2)列出下表,并用科学计算器进行有关计算: i xi yi xiyi 因此,x=
1 2 30 60 522 4 40 160 523 5 60 300 54 6 50 300 5 8 70 560 25250=5,y= =50, ?x=145, ?y=13 500, ?xy=1 380。 55i?1ii?1ii?1ii于是可得:b=
?xy?5x?yi?1ii5?x?5x2i?1i5=
21380?5?5?50=6.5; a=y-bx=50-6.5×5=17.5
145?5?5?5 23
因此,所求回归直线方程为:y?6.5x?17.5。
(3)根据上面求得的回归直线方程,当广告费支出为10百万元时,y=6.5×10+17.5=82.5(百万元),即这种产品的销售收入大约为82.5百万元。 (三)、小结反思:1、相关关系的理解:(1)相关关系是非随机变量与随机变量之间的关系,而函数关系则是两个非随机变量之间的关系,虽然两者均是指两个变量之间的关系,但不能把相关关系等同于函数关系。(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系。2、两个变量的线性相关:(1)对已知双曲线方程,则渐近线方程确定。具有相关关系的两个变量进行统计的方法叫回归分析。回归分析是寻找相关关系中非确定性关系的某种确定性。(2)将n个数据点(xi,yi)(i?1,2,......n)描在平面直角坐标系中,以表示具有相关关系的两个变量的一组数据的图形叫做散点图。散点图形像地反映了各数据的密切程度。3、两个变量的相关关系分析:可根据样本数据散点图确定两个变量之间是否存在相关关系,然后利用最小二乘法求出回归直线方程。 (四)、作业布置:限时训练22中12、14
课外练习:限时训练22中2、3、4、7、8、10、11、13
五、教学反思:
24
??第七课时 用样本估计总体及线性相关关系
——热点考点题型及解法探析
一、复习目标 1、通过本课,强化有关概念及方法的理解、掌握和应用。2、探析热点考点题型及解法,训练学生灵活、综合运用能力及分析解决问题的能力。 二、重难点:概念及方法的理解运用。 三、教法:讲练结合,探析归纳。 四、教学过程
(一)热点考点题型及解法探析 题型1:数字特征
例1.为估计一次性木质筷子的用量,1999年从某县共600家高、中、低档饭店抽取10家作样本,这些饭店每天消耗的一次性筷子盒数分别为:
0.6 3.7 2.2 1.5 2.8 1.7 1.2 2.1 3.2 1.0
(1)通过对样本的计算,估计该县1999年消耗了多少盒一次性筷子(每年按350个营业日计算); (2)2001年又对该县一次性木质筷子的用量以同样的方式作了抽样调查,调查的结果是10个样本饭店,每个饭店平均每天使用一次性筷子2.42盒.求该县2000年、2001年这两年一次性木质筷子用量平均每年增长的百分率(2001年该县饭店数、全年营业天数均与1999年相同);
3
(3)在(2)的条件下,若生产一套学生桌椅需木材0.07m,求该县2001年使用一次性筷子的木材可以生产多少套学生桌椅。计算中需用的有关数据为:每盒筷子100双,每双筷子的质量为5g,
33
所用木材的密度为0.5×10kg/m;
(4)假如让你统计你所在省一年使用一次性筷子所消耗的木材量,如何利用统计知识去做,简要地用文字表述出来。 解析:(1)x?1(0.6?3.7?2.2?1.5?2.8?1.7?1.2?2.1?3.2?1.0)?2.0 10所以,该县1999年消耗一次性筷子为2×600×350=420000(盒)。
2
(2)设平均每年增长的百分率为X,则2(1+X)=2.42, 解得X1=0.1=10%,X2=-2.1(不合题意,舍去)。所以,平均每年增长的百分率为10%。 (3)可以生产学生桌椅套数为
0.005?2.42?100?600?350?7260(套)。
0.5?103?0.07(4)先抽取若干个县(或市、州)作样本,再分别从这些县(或市、州)中抽取若干家饭店作样本,统计一次性筷子的用量.
点评:本题是一道统计综合题,涉及的知识点很多,需要灵活运用各种知识分析解决问题.对于第(1)小题,可先求得样本平均数,再利用样本估计总体的思想来求得问题的解.对于第(2)小题,实际是一个增长率问题的应用题,可通过设未知数列方程的方法来解.对于第(3)小题,用到了物理公式m=ρv, 体现了各学科知识之间的联系,让学生触类旁通,在解决实际问题时能综合运用多种知识灵活地解决问题.第(4)小题只要能够运用随机抽样方法,能体会到用样本估计总体的统计思想就可解决,在文字表述上要注意简洁、明了、正确。 题型2:数字特征的应用 例2.(2008年全国高考天津文科卷(15))甲、乙两种冬小麦试验品种连续5年的平均单位面积
2
产量如下(单位:t / hm) 品第1年 第2年 第3年 第4年 第5年 种 甲 9.8 9.9 10.1 10 10.2 乙 9.4 10.3 10.8 9.7 9.8 其中产量比较稳定的小麦品种是 甲 。 1 1 解析:xˉˉ甲 = 5( 9.8 + 9.9 + 10.1 + 10 + 10.2) = 10.0,x乙 = 5( 9.4 + 10.3 + 10.8 + 9.7
25