1.2 独立性检验的基本思想及其初步应用
1.理解独立性检验的基本思想及其实施步骤.(重点) 2.能利用条形图、列联表探讨两个分类变量的关系.(易混点) 3.了解K2的含义及其应用.
4.通过对数据的处理,来提高解决实际问题的能力.(难点)
[基础·初探]
教材整理1 分类变量与列联表
阅读教材P10~P13的内容,完成下列问题. 1.分类变量
变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. 2.列联表
(1)定义:列出的两个分类变量的频数表,称为列联表.
(2)2×2列联表:一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
x1 x2 总计 y1 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d
下面是一个2×2列联表:
1
x1 x2 总计 y1 a 8 b y2 21 25 46 总计 73 33 则表中a,b处的值分别为________. 【解析】 ∵a+21=73,∴a=52. 又b=a+8=52+8=60. 【答案】 52,60 教材整理2 等高条形图
阅读教材P14的内容,完成下列问题.
1.定义:将列联表中的数据用高度相同的两个条形图表示出来,其中两列的数据分别对应不同的颜色,这就是等高条形图.
2.等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.
3.观察等高条形图发现关系.
观察下列各图,其中两个分类变量x,y之间关系最强的是________.
ac和相差很大,就判断两个分类变量之间有a+bc+d
图1-2-1
【解析】 在四幅图中图(4)中两个深色条的高相差最明显,说明两个分类变量之间关系最强,故选(4).
【答案】 (4)
教材整理3 独立性检验
2
阅读教材P12的内容,完成下列问题. 1.定义
利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验. 2.公式
n?ad-bc?2
K=,其中n=a+b+c+d.
?a+b??c+d??a+c??b+d?
2
1.关于分类变量x与y的随机变量K2的观测值k,下列说法正确的是________(填序号).
(1)k的值越大,“X和Y有关系”可信程度越小; (2)k的值越小,“X和Y有关系”可信程度越小; (3)k的值越接近于0,“X和Y无关”程度越小; (4)k的值越大,“X和Y无关”程度越大.
【解析】 k的值越大,X和Y有关系的可能性就越大,也就意味着X和Y无关系的可能性就越小.
【答案】 (2)
2.式子|ad-bc|越大,K2的值就越________.(填“大”或“小”) 【解析】 由K2的表达式知|ad-bc|越大,(ad-bc)2就越大,K2就越大. 【答案】 大
[小组合作型] 用2×2列联表分析两变量间的关系 在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33a人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用a+b与c
c+d判断二者是否有关系.
3