【知识点:统计】 一.简单随机抽样 1.总体和样本
总体:在统计学中 , 把研究对象的全体叫做总体. 个体:把每个研究对象叫做个体.
总体容量:把总体中个体的总数叫做总体容量.
为了研究总体的有关性质,一般从总体中随机抽取一部分:研究,我们称它为样本.其中个体的个数称为样本容量。 ......
2.简单随机抽样,也叫纯随机抽样。就是从总体中不加任何分组、划类、排队等,完全随 机地抽取调查单位。特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。简单随机抽样是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。 3.简单随机抽样常用的方法:
(1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。
在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。
4.抽签法:
(1)给调查对象群体中的每一个对象编号; (2)准备抽签的工具,实施抽签
(3)对样本中的每一个个体进行测量或调查
例:请调查你所在的学校的学生做喜欢的体育活动情况。 5.随机数表法:
例:利用随机数表在所在的班级中抽取10位同学参加某项活动。 二.系统抽样
1.系统抽样(等距抽样或机械抽样):
把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。
d(抽样距离)=N(总体规模)/n(样本规模) 三.分层抽样
1.分层抽样(类型抽样):
先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,
,
,
,
然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。
2.分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。 3.分层的比例问题:
(1)按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。 四.样本频率分布图
1.作图步骤:(1)求极差(一组数据中最大值和最小值得差)(2)决定组距和组数; (3)将数据分组;(4)计算各小组的频率,列频率分布表;(5)画频率分布直方图 2.特点:(1)以面积的形式反映数据落在各小组的频率大小;
频率?频率组距(3)各小长方形的面积的总和等于1.
(2)小长方形的面积?组距?五.茎叶图
适用范围:在样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录。当样本数据较多时,茎叶图就不太方便了。 六.用样本的数字特征估计总体的数字特征 1、本均值:x?x1?x2???xn
n2(x1?x)2?(x2?x)2???(xn?x)22、.样本标准差:s?s?
n3.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差。在随机抽样中,这种偏差是不可避免的。
虽然我们用样本数据得到的分布、均值和标准差并不是总体的真正的分布、均值和标准差,而只是一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息。
4.(1)如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变 (2)如果把一组数据中的每一个数据乘以一个共同的常数k,标准差变为原来的k倍 五.两个变量的线性相关
????bx?a 1、概念: (1)回归直线方程 y? (2)回归系数 b??(xi?1nni?x)(yi?y)??xyii?1ni?1ni?nxy2?? a?y?bx
?(xi?x)2i?1?xi2?nx2.最小二乘法 3.直线回归方程的应用
(1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存
的数量关系
(2)利用回归方程进行预测;把预报因子(即自变量x)代入回归方程对预报量(即
因变量Y)进行估计,即可得到个体Y值的容许区间。
(3)利用回归方程进行统计控制规定Y值的变化,通过控制x的范围来实现统计控
制的目标。
(4)回归直线一定经过样本的中心点(x,y),据此性质可以解决有关的计算问题. 【例题讲解】
1. 某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,
那么由此求出的平均数与实际平均数的差是( ) A 3.5 B ?3 C 3 D ?0.5
2. 设有一个直线回归方程为y?2?1.5x,则变量x增加一个单位时( )
A y平均增加1.5个单位
B y平均增加2个单位
C y平均减少1.5个单位
D y平均减少2个单位
3. 从N个编号中抽取n个号码入样,若采用系统抽样方法进行抽取, 则分段间隔应为( )
A N?N??N? B n C ?? D ???1 n?n??n?
4.从某厂生产的802辆轿车中抽取80辆测试某项性能.请合理选择抽样方法进行抽样,并写出抽样过程.
5. 为了了解参加运动会的2000名运动员的年龄情况,从中抽取100名运动员;就这个问题,下列说法中正确的有 ;
① 2000名运动员是总体;②每个运动员是个体;③所抽取的100名运动员是一个样本; ④样本容量为100;⑤这个抽样方法可采用按年龄进行分层抽样;⑥每个运动员被抽到的概率相等
6. 数据70,71,72,73的标准差是______________
7. 数据a1,a2,a3,...,an的方差为?,平均数为?,则
(1)数据ka1?b,ka2?b,ka3?b,...,kan?b,(kb?0)的标准差为 ,
平均数为
2(2)数据k(a1?b),k(a2?b),k(a的标准差为 ,kb?0)3?b),...,k(an?b),(平均数为
8. 用样本频率分布估计总体频率分布的过程中,下列说法正确的是( )
A 总体容量越大,估计越精确 B 总体容量越小,估计越精确
C 样本容量越大,估计越精确 D 样本容量越小,估计越精确
9 从两个班中各随机的抽取10名学生,他们的数学成绩如下: 甲班 乙班 76 86 74 84 82 62 96 76 66 78 76 92 78 82 72 74 52 88 68 85
画出茎叶图并分析两个班学生的数学学习情况
【课堂练习】
1. 相关关系与函数关系的区别是
2. 从10个篮球中任取一个,检验其质量,则应采用的抽样方法为_______________ 3. 下列说法错误的是 ( )
A 在统计里,把所需考察对象的全体叫作总体
B 一组数据的平均数一定大于这组数据中的每个数据
C 平均数、众数与中位数从不同的角度描述了一组数据的集中趋势
D 一组数据的方差越大,说明这组数据的波动越大
4. 要了解全市高一学生身高在某一范围的学生所占比例的大小,需知道相应样本的( )
A 平均数 B 方差 C 众数 D 频率分布
5. 要从已编号(160)的60枚最新研制的某型导弹中随机抽取6枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的6枚导弹的编号可能是( )
A 5,10,15,20,25,30 B 3,13,23,33,43,53
C 1,2,3,4,5,6 D 2,4,8,16,32,48
6. 数据a1,a2,a3,...,an的方差为?,则数据2a1,2a2,2a3,...,2an的方差为( )
2?2A
2
B ?2
C 2?2
D 4?
27. 已知样本9,10,11,x,y的平均数是10,标准差是2,则xy?
8. 有50件产品编号从1到50,现在从中抽取5件检验,用系统抽样
确定所抽取的编号为( )
A 5,10,15,20,25 B 5,15,20,35,40
C 5,11,17,23,29 D 10,20,30,40,50
9.(2013·武夷模拟)用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生随机地从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为126,则第1组中用抽签的方法确定的号码是________. 10.(2012·江西)样本(x1,x2,…,xn)的平均数为x,样本(y1,y2,…,ym)的平均数为y(x1≠y).若样本(x1,x2,…,xn,y1,y2,…,ym)的平均数z=αx+(1-α)y,其中0<α<,
2则n,m的大小关系为 A.n ( ). D.不能确定 B.n>m C.n=m 11.已知施化肥量x与水稻产量y的试验数据如下表,则变量x与变量y是________相关(填“正”或“负”). 施化肥量x 水稻产量y 15 330 20 345 25 365 30 405 35 445 40 450 45 455 12.(2013·长春调研)已知x,y取值如下表: