统计及统计案例(艺术) 一. 知识网络 简单随机抽样
系统抽样 随机抽样
分层抽样 频率分布表 频率分布直图 总体估计 统计 折线图与茎叶图 数字特征
散点图
变量的相关性
线性回归方程
二. 随机抽样 (一)、简单随机抽样
1.简单随机抽样的概念
从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体有 的可能性被抽到,这种抽样方法叫做简单随机抽样
2.最常用的简单随机抽样方法有两种—— 法和 . (二)、系统抽样
1.系统抽样的概念:将总体分成 的若干部分,然后按照预先制定的规则,从每一部分抽取 个体,得到所需要的样本,这样的抽样叫做系统抽样.在抽样过程中,由于抽样的间隔 ,因此系统抽样也称作 抽样. 2、系统抽样的步骤:
假设要从容量为N的总体中抽取容量为n的样本.(1)先将总体的N个个体 . (2)确定 ,对编号进行 ,当是整数时,取 k=. (3)在第1段用 确定第一个个体编号l(l≤k).
(4)按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号 ,再加k得到第3个个体编号 ,依次进行下去,直到获取整个样本. (三)、分层抽样
1.当总体由 的几部分组成时,为了使抽取的样本更好地反映总体的情况,常将总体中各个个体按 分成若干个 的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行 ,这种抽样方法叫做分层抽样. 2.分层抽样时,每个个体被抽到的机会是 的.
(四).[究 疑 点]:三种抽样方法的共同点及联系是什么?
NnNn类别 简单随机抽样 系统 抽样 共同点 各自特点 相互联系 适用范围 总体中的个体数较少 从总体中逐个抽取 无 分层 抽样 抽样过将总体均匀分成几在起始部分抽程中每部分,按事先确定总体中的个样时采用简单个个体的规则在各部分抽体数较多 随机抽样 被抽取取 的机会均等 各层抽样时采总体由差异将总体分成几层,用简单随机抽明显的几部分层进行抽取 样或系统抽样 分组成 (五)随堂练习
1.在简单抽样中,某一个个体被抽的可能是 ( )
A.与第几次抽样有关,第一次抽中的可能性大些。 B.与第几次抽样无关,每次抽中的可能性相等。 C.与第几次抽样有关,最后一次抽中的可能性较大。
D.与第几次抽样无关,每次都是等可能的抽取,但各次抽取的可能不一样。 2.关于简单随机抽样的特点,有以下几种说法,其中不正确的是 ( ) .A.要求总体的个数有限B.从总体中逐个抽取
C.它是一种不放回抽样D.每个个体被抽到的机会不一样,与先后有关
3. 下列抽样中不是系统抽样的是 ( )
(A)从标有1~15号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5, i+10(超过15则从1再数起)号入样
(B)工厂生产的产品,用传关带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验
(C)搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止
(D)电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈
4.N个编号中抽n个号码作样本,考虑用系统抽样方法,抽样间距为 ( ) A.
N?N??N? B.n C.?? D.??+1 n?n??n?5、某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上的人,用分层抽样的方法从中抽取20人,各年龄段分别抽取多少人( )。 A.7,5,8 B.9,5,6 C.6,5,9 D.8,5,7
6.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是( )。 A.分层抽样法,系统抽样法 B.分层抽样法,简单随机抽样法 C.系统抽样法,分层抽样法 D.简单随机抽样法,分层抽样法
7、为调查参加运动会的1000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是( )。 A.1000名运动员是总体 B.每个运动员是个体
C.抽取的100名运动员是样本 D.样本容量是100 8、(2009年广东卷文)某单位200名职工的年龄分布情况如图2,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1-200编号,并按编号顺序平均分为40组(1-5号,6-10号?,196-200号).若第5组抽出的号码为22,则第8组抽出的号码应是 。若用分层抽样方法,则40岁以下年龄段应抽取 人。
9..从2008名学生中选取50人参加全国 数学联赛,若采用下面的方法选取:先
用简单随机抽样从2008人中剔除8人,剩下的2000人再按系统抽样的方法抽取,则每人入选的概率( )A.不全相等 B.均不相等 C.都相等,且为
251 D.都相等,且为
40100410、从某地区15000位老人中随机抽取500
人,其生活能否自理的情况如下表所示: 则该地区生活不能自理的老人中男性比 女性约多______人。
三. 统计图表与数据的数字特征 (一).作频率分布直方图的步骤
1.求极差(即一组数据中______与_______的差)2.确定______与___________ 3.将数据__________与____________4.列_______________ 5.画____________ (二)、频率分布折线图和总体密度曲线
1.频率分布折线图:连接频率分布直方图中各小长方形上端的 ,就得频率分布折线图.
2.总体密度曲线:随着 的不断增大,分组的 不断缩小则频率分布直方图实际上越来越接近于 ,它可以用一条光滑曲线y=f(x)来描绘,这条光滑曲线就叫做总体密度曲线. 3.样本的数字特征 数字特征 定义 众数 中位数 在一组数据中,出现次数 的数据叫做这组数据的众数. 将一组数据按大小依次排列,把处在__________位置的一个数据(或最中间两个数据的平均数)叫做这组数据的 . 在频率分布直方图中,中位数左边和右边的直方图的面积应该 . 样本数据的算术平均数,即x=_______________ 平均数 方差 s2?_________________________ 其中s为标准差 (三)随堂练习
1.一个容量为32的样本,已知某组样本的频率为0.375, 则该组样本的频数为 ( ) A.4 B.8 C.12 D.16
2.在育才中学举行的电脑知识竞赛中,将九年级两个班参 赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第一、三、四、五小组的频率分别是0.30,0.15,0.10,0.05.则第二小组的小长方形的高为 ( )
A.0.04 B.0.40 C.10 D.0.025
3.某大学对1 000名学生的自主招生水平测试成绩进行统
计,得到样本频率分布直方图如图所示,现规定不低于70分为合格,则合格的人数是________
4.一个容量为35的样本数据,分组后,组距与频数如下:(5,10] :5个,(10,15]:12个,(15,20]:7个,(20,25]:5个,(25,30]:4个,(30,35]:2个,则样本在区间(20,+∞)上的频率约为( )
A、20% B、69% C、31% D、27%
5、在用样本频率估计总体分布的过程中,下列说法中正确的是( ) A、总体容量越大,估计越精确 B、总体容量越小,估计越精确 C、样本容量越大,估计越精确 D、样本容量越小,估计越精确
6、某工厂有10名工人,他们某天生产同一零件,生产的件数是15,17,14,10,15,17,
17,16,14,12。设其平均数为a,中位数为b,众数为c,则有( ) A、a>b>c B、b>c>a C、c>a>b D、c>b>a
7、在统计中,样本数据的方差可以近似的反应数据总体的( ) A、平均状态 B、分布规律 C、最大值和最小值 D、波动大小
8、某人射击10次,得环数如下:18,20,19,22,20,21,19,19,20,21,则这组数据的
平均数是 ,方差是 。
9.如图是2010年全国电视舞蹈大赛上,七位评委为某民 族舞蹈打出的分数的茎叶图,去掉一个最高分和一个 最低分后,所剩数据的平均数和方差分别为 ( ) 7 8 9
9
4 4 6 4 7 3
A.84,4.84 B.84,1.6 C.85,1.6 D.85,4 10、(2009浙江卷文)某个容量为100的样本的布直方图如下,则在区间[4,5)上的数据的频数..为 。
(四)典型例题
例1.(2010·东北三校第一次联考)某学了解学生的日平均睡眠时间(单位:h),随机选
名同学进行调查.下表是这n名同学的日睡眠时间的频率分布表.
(1)求n的值;若a=20,将表中数据补全,并画出频率分布直方图; (2)统计方法中,同一组数据常用该组区间的中点值(例如区间[4,5)的中点值是4.5)作为代表.若据此计算的上述数据的平均值为6.52,求a,b的值,并由此估计该学校学生的日平均睡眠时间在7小时以上的概率.
频率分
校为了择了n序号(i) 分组(睡眠时间) 频数(人数) 频率 1 2 3 4 5 [4,5) [5,6) [6,7) [7,8) [8,9) 6 0.12 0.20 0.08 a b