3. 变量的相关性 ⑴ 通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系. ⑵ 经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 二、内容安排及说明 全章共有3个小节,教学约需16课时,具体内容和课时分配如下:(仅供参考) 2.1 随机抽样 约5课时 阅读与思考 一个著名的案例 阅读与思考 广告中数据的可靠性 阅读与思考 如何得到敏感性问题的诚实反应 2.2 用样本估计总体 约5课时 阅读与思考 生产过程中的质量控制图 2.3变量间的相关关系 约4课时 阅读与思考 相关关系的强与弱 实习作业 约1课时 小结 约1课时 2.知识结构框图 随机抽样 简分系单层统 随抽抽 机样 样 抽 样 3.对内容安排的说明 用样本的频率分布估计总体分 布 用样本估计总体 变量间的相关关系 用样本数字特征估计总体数字特征 线性回归分析 与《大纲》相比,《标准》对于本部分内容的要求发生了一些变化,主要体现在: 1.在内容编排顺序上,统计和概率由理科选修内容变成了必修内容;由先学概率后学统计变成了先学统计后学概率,原因是: ⑴ 考虑到统计与概率学科发展的历史是先有统计,为了研究统计结论的可靠性问题,概率得到了发展; ⑵ 考虑到学生的学习心理,统计在前,使得学生在学习过程中可以接触到大量统计案例, 11
学习过程中的实践性可以大大增强.
2.在教学要求上,由强调图表、数据的计算,变为强调统计思想与运用统计思想解决实际问题的能力.
本章内容安排遵循的主线是:提出问题→收集数据→分析和整理数据→预测和决策.具体内容的编排顺序是:首先通过实例引出抽样的必要性,抽样时所应考虑的问题,样本的质量(代表性)和所推断的结论之间的关系;然后介绍了几种常用的随机抽样方法:简单随机抽样、系统抽样和分层抽样.抽样的目的是为了获得总体分布信息,教科书接下来介绍了几种获得总体分布信息的方法,包括:用样本频率分布估计总体分布、用样本数字特征估计总体数字特征,教科书还介绍了用线性回归分析的方法研究变量的相关关系.
通过对这些统计方法的学习,学生将了解用样本估计总体及其特征的思想,体会统计思维与确定性思维的差异;通过实习作业的学习,学生将较为系统地经历数据收集与处理的全过程.
三、主要内容的编写意图与教学建议
由于本章在内容编排、结构设置等方面与传统教科书相比都发生了较大的变化,下面针对一些重点内容和新内容的编写意图作一些说明,以有利于老师们了解这些内容的教学要求.
1.随机抽样
在义务教育阶段学生已经学习了一些有关抽样调查的知识,本章的侧重点在于如何能够获得高质量的样本,了解方便样本的缺点以及随机样本的简单性质.下面是这部分的主要内容和需要说明的问题.
⑴ 本章首先通过大量的日常生活中事实,引导学生认识抽样的必要性和重要性,即: ① 获取数据的过程具有破坏性不容许普查; ② 人力、物力、财力、时间的限制; ③ 普查组织过程中的失误导致误差; ④ 有代表性的样本可以得到可靠的推断.
⑵ 随机抽样关注的核心问题——样本的代表性的好坏.教科书用一勺汤来“判断一锅汤的味道”的浅显道理,使学生认识到把总体“搅拌均匀”是取得有代表性总体的关键所在,“搅拌均匀”的本质是使总体中的每个个体入选到样本的可能性相等.教科书还用了3个案例来进一步说明这个问题,它们分别是:
“一个著名的案例”说明了样本代表性的重要性,使学生体会抽样不是简单的从总体中取出几个个体的问题,它关系到最后的统计分析结果是否可靠.这个案例还隐含着方便样本代表性差的问题.
“广告中数据的可靠性”使学生能从样本代表性的角度思考日常生活中的数字统计结果的科学性问题.
“考察800袋牛奶的质量”在学生体会到样本的重要性之后,探讨获取能够代表总体样本的方法.
⑶ 如何获得具有好的代表性的随机样本呢?本章介绍了三种简单随机抽样方法——简单随机抽样、系统抽样和分层抽样.教学时可结合教科书中的例子引导学生理解这三种抽样方法的特点.其中,简单随机抽样包括抽签法(抓阄法)和随机数表法,它最能体现“搅拌均匀”“机会均等”的原则,但操作较困难.系统抽样的特点是:
① 系统抽样比其他随机抽样方法更容易施行,可节约抽样成本;
② 系统抽样所得样本的代表性和具体的编号有关,如果编号的个体特征随编号有一定的
12
周期性,可能会使系统抽样的代表性很差; ③ 系统抽样可以应用到个体有自然编号,但是总体中个体的数目却在抽样时无法确定的情况(如生产线的产品的质量检验). 因此,系统抽样比简单随机抽样的应用范围广.分层抽样充分利用了已知的总体信息,得到的样本比前两种方法有更好的代表性,并且可得到各层的子样本以估计各层的信息. 在比较三种抽样方法的优缺点的基础上,让学生了解选择合适的抽样方法,以保证样本的好的代表性,以便得到对总体的较准确的推断,这也是学习抽样方法的目的. 2.用样本估计总体 ⑴ 这部分内容关注的核心问题是“用样本的信息估计总体信息”,包括用样本频率分布估计总体分布和用样本的数字特征估计总体数字特征.在实际应用中,总体分布可以为合理决策提供依据(总体分布描述了总体在各个范围内个体的百分比),因此很多实际问题的解答都转化为求总体分布的问题,其求解途径就是通过样本来估计总体分布.在很多情况下,总体分布是由几个总体数字特征所唯一决定的,或者需要解决的统计问题是关于总体数字特征的问题.这就需要估计总体的数字特征,其求解途径也是通过样本来估计. 教科书通过探究栏目提出“居民生活用水定额管理问题”,引出总体分布的估计问题,以及估计总体分布的途径,而且这个问题贯穿本节始终.通过对该问题的探究,学生将在以前学习的基础上进一步学习列频率分布表、画频率分布直方图、频率分布折线图和总体密度曲线.教师可以利用初中有关随机事件的知识,引导学生进一步体会由样本确定的频率分布直方图的随机性;通过初中有关频率与概率之间的关系,进一步了解频率分布直方图的规律性,即频率分布与总体分布之间的关系,体会用样本估计总体的思想来源. ⑵ 由于样本频率分布直方图可以估计总体分布直方图,因此可以用样本频率数字特征来估计相应的总体数字特征,本章还展示了利用频率分布直方图估计总体分布的众数、中位数和平均数的方法.需要说明的是: ① 总体的中位数和平均数都可以通过相应的样本中位数和样本平均数来估计,并且这样的估计通常具有更高的精度,可以通过计算机模拟让学生体会这一点; ② 通过频率分布直方图的估计结果与数据分组有关; ③ 在不能得到样本数据,只能得到频率分布直方图的情况下,用这种方法也可以达到估计总体数字特征的目的. 当然,用样本频率数字特征来估计相应的总体数字特征的意义在于,当原始样本数据丢失时仍可以估计总体特征. ⑶ 像频率分布表和频率分布直方图一样,茎叶图也是用来表示样本数据分布的一种方法.本章通过比较甲乙两名运动员比赛得分情况引入茎叶图,并为了方便比较,把甲乙两个运动员比赛得分的茎叶图画在一起.实际上,可以对任何一个样本作茎叶图,如可以作出甲运动员得分的茎叶图: 甲运动员得分茎叶图 茎 叶 0 8 1 3 4 6 2 3 6 8 3 3 8 9 4 5 1 从茎叶图中的枝叶分布情况可以直接感受到样本数据的分布特点,它不损失任何样本分布信息,帮助发现中位数和极差,也可以计算得到以下信息: 乙的均值=33 甲的均值=26.27 13
乙的标准差=11.74 甲的标准差=13.17 乙的中位数=36 甲的中位数=26 乙的极差=38 甲的极差=43 由此推断:乙运动员发挥比较稳定,总体得分情况比甲好. 绘制茎叶图时需要注意的是: ① 可以手工画图,也可以利用统计软件画图.中间数字表示得分的十位数,称为茎;两边数字分别表示两个人各场比赛得分的个位数,称为叶(故称茎叶图). ② 可以画一组数据的茎叶图,竖线左边为茎,右边为叶. ③ 为比较两两组数据的分布特征,可以画一张图共茎的茎叶图. 茎叶图的优点是: ① 从统计图上没有信息的损失,所有的信息都可以从茎叶图中得到,即茎叶图保留了原始数据. ② 茎叶图可以在比赛时随时记录,方便记录与表示. ⑷ 描述样本数据的离散程度的方法很多,最常用的就是样本标准差(方差),它反映了各个样本数据聚集于样本平均数周围的程度.样本标准差越大,表明各个样本数据在样本平均数的周围越集中;反之,表明各个样本数据在样本平均数的两边越分散. 本章构造了一个容量为2的样本:x1和x2(x1<x2),让学生体会两个样本数据分散程度与样本标准差a=x2?x1之间的关系,总结出标准差等于0意味着所有的样本数据都等于样本平2均数的结论. 3.变量间的相关关系 ⑴ 这部分内容是以最小二乘法的思想为核心的.教科书通过探究案例“人体脂肪百分比和年龄之间的关系”,引入描述两个变量之间关系的散点图和线性回归方程,使学生通过探索用多种方法确定线性回归直线,体会最小二乘法的思想,同时领悟到用线性回归方程可以做出预测;通过案例“小卖店每天卖出的热饮杯数与当天气温的关系”,使学生了解利用线性回归方程解决实际问题的全过程,体会线性回归方程在预测结果时的随机性,并且可能犯错误. ⑵ 对于散点图与变量之间的关系,需要说明的是: ① 如果所有的样本点都落在某一函数曲线上,变量之间具有函数关系. ② 如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系. ③ 如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系. ⑶ 为了帮助学生了解最小二乘法的思想,可以先让学生自己设计求回归直线方程的方案,例如,学生可能提出下列方案: 方案1:采用测量的方法,先画一条直线,测量出各点到它的距离,然后移动直线,到达一个使距离之和最小的位置,测量出此时直线的斜率和截距,就得到回归方程. 方案2:在图中选取两点画直线,使得直线两侧的点的个数基本相同. 方案3:在散点图中多取几组点,确定几条直线的方程,分别求出各条直线的斜率和截距的平均数,将这两个平均数作为回归方程的斜率和截距. 然后引导学生用数学的方法刻画“从整体上看,各点与此直线的距离最小”,即推导出最小二乘法的公式. 在用线性回归方程进行预测时,需要注意的是: ① 自变量的值应该是精确的值,线性回归方程中的截距和斜率都是通过样本估计出来的,存在随机误差,这种误差可以导致预测结果的偏差. ?能够② 即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x的预报值,y与实际值y很接近.我们不能保证点?x,y?落在回归直线上,甚至不能百分之百地保证它落在 14
回归直线的附近.事实上, ??e, y?bx?a?e?y?与实际值y的接近程度由随机变量e的标准差所决定. 这里e是随机变量,预报值y 第三章 概率 简介 在自然界与人类的社会活动中会出现各种各样的现象,既有确定性现象,又有随机现象.随机现象在日常生活中随处可见,概率是研究随机现象规律的学科,它为人们认识客观世界提供了重要的思维模式和解决问题的方法. 近年来,统计在实际中得到广泛的应用,用数据、图表等说明问题更有说服力,更直观、更容易理解.概率为统计学的发展提供了理论基础.由于概率统计的应用性强,有利于培养学生的应用意识和动手能力,《标准》加强概率统计的份量成为必然,目的就在于发展数学应用意识,使学生体会数学在实际中的应用价值,同时更全面地培养学生解决问题的能力. 一、内容与要求 1. 利用随机事件的频率给出概率的定义与性质. 2. 通过试验模拟等方法澄清日常生活中对概率的错误认识.给出应用概率解决实际问题的几个例子,包括用概率检验游戏的公平性,概率在决策中的应用,概率在天气预报中的应用,等等. 3. 给出两个概率模型(古典概型和几何概型)下概率的计算公式. 4. 有两种产生随机数的方法,一种是由试验产生的随机数,另一种是利用计算器或计算机产生的(伪)随机数,通过模拟的方法估计随机事件发生的概率. 5. 通过阅读与思考等栏目加深对随机现象的理解,了解人类认识随机现象的过程是逐步深入的,了解概率这门学科在实际中有广泛的应用. 二、内容安排及说明 1. 本章包括3个小节,教学约需8课时,具体内容和课时分配如下(仅供参考): 3.1 随机事件的概率 约3课时 阅读与思考 天气变化的认识过程 3.2 古典概型 约2课时 3.3 几何概型 约2课时 阅读与思考 概率和密码 小 结 约1课时 2.知识结构框图 应用概率解决实际问题 随机事件 频率 概率,概率的意义与性质 古典概型 几何概型 15 随机数与随机模拟