9.变量间的相关程度,可以用不知Y与X有关系时预测Y的全部误差E1,减去知道Y与X有关系时预测Y的联系误差E2,再将其化为比例来度量,这就是( 削减误差比例 )。
10.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y围绕每个估计值Yc是服从( );
11.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计和预测。这种分析方法,通常又称为( 回归分析 )
12、变量层次一般分为 、 、 和 。 13、统计按其内容主要包括两个方面: 分析和 分析。 14、定类层次主要的集中趋势法是 ,定序层次主要的离散趋势法是 。 15、统计推论分为参数估计和 ,其中参数估计又分为 和 。 16、置信区间与可信度之间是成 关系,即估计的区间越大,则可信度也就越 。
17、根据样本计算出来的一切统计数字特征值被称为 ,总体值称为 。 18、众数运用 层次变量的集中趋势分析,中位数用于 层次变量的集中趋势分析,均值用于定距层次变量的 分析,标准差用于定距层次变量的 分析。
19、正态分布图的形状和位置主要由 和 决定。
20、测量两个变量的相关系数时,首先考虑的是变量的 ,其次考虑变量间是否对称,最后最好选用具备 意义的相关系数。
21、以样本的统计值来估计总体的参数值,有两大类做法,一类是 ,另一类是 ,二者均要求样本是以 方法抽取的。
22、某一孕妇生男生女纯属偶然现象,但全市出生的婴儿性别比例一直维持在50%左右,这种现象称为 定理。
23、假设检验时,首先需要做出 假设和被择假设,并以 假设为基础进行数据推导,如果我们的统计检验值落在 ,我们就应该接受被择假设。
三、判断题
1.社会统计描述,即通过部分研究对象的统计资料对研究对象的总体的性质进行推论与归纳。 ( )
2.推论统计需要的统计资料相对而言较少,所以在人力、物力及时间等方面比较经济,研究和应用的范围也拓宽了许多。( )
3.无论分布曲线是正偏还是负偏,中位数都居算术平均数和众数之间。( ) 4.在同样的显著性水平的条件下,单侧检验较之双侧检验,可以在犯第一类错误的危险不变的情况下,减少犯第二类错误的危险。( √ )
5.统计检验可以帮助我们否定一个假设,却不能帮助我们肯定一个假设。 ( √ )
6.检验的显著性水平(用?表示)被定义为能允许犯第一类错误的概率,它决定了否定域的大小。( √ )
7.第一类错误是,零假设H0实际上是错的,却没有被否定。第二类错误则是,零假设H0实际上是正确的,却被否定了。 ( × )
8.每当方向能被预测的时候,在同样显著性水平的条件下,双侧检验比单侧检验更合适。 ( × )
9.进行区间估计,置信水平总是预先给定的。 ( √ )
10.由于削减误差比例的概念不涉及变量的测量层次,因此它的优点很明显,用它来定义相关程度可适用于变量的各测量层次。( √ )
11.不管相关关系表现形式如何,当r=1时,变量X和变量Y都是完全相关。( √ )
12.不管相关关系表现形式如何,当r=0时,变量X和变量Y都是完全不相关。( × )
13.通过列联表研究定类变量之间的关联性,这实际上是通过相对频数条件分布的比较进行的。而如果两变量间是相关的话,必然存在着Y的相对频数条件分布相同,且和它的相对频数边际分布相同。( × )
14.如果众数频数集中在条件频数分布列联表的同一行中,?系数便会等于0,从而无法显示两变量之间的相关性。 ( √ )
15.从分析层次上讲,相关分析更深刻一些。因为相关分析具有推理的性质,而
回归分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。 ( × )
16、离散趋势是测量数据间的差异程度。 ( )
17、两个定类变量间的相关系数范围在[-1,1]间。 ( ) 18、相关系数r等于-1,说明变量之间不存在相关关系。 ( ) 19、标准正态分布的曲线对称轴为X=0。 ( )
20、当样本量n>30时,无论n如何增大,样本的统计值倾向稳定。 ( ) 21、参数估计就是在一定的抽样误差内设一个可置信的区间,然后联系到这个区间的精度,将样本的统计值推断为总体的参数值。 ( ) 22、假设检验与参数估计最终关心的都是总体的参数状况。 ( ) 23、利用样本对总体进行区间估计时,置信度越高,则区间就越窄。 ( ) 24、假设检验过程中,如果统计检验值大于临界值,则拒绝零假设。 ( ) 25、在积矩相关分析结果r=0,则说明两变量不呈直线相关。 ( ) 26、根据研究需要,可以将定距变量降格为定类变量进行分析。 ( ) 27、某公司员工的月收入标准差为100元,说明该公司员工收入差距大。( ) 28、直方图用于定类层次的变量作图。 ( )
29、推论统计关注的是样本的统计值而不是总体的参数值。 ( ) 30、对大样本的假设检验选用Z检验法,主要是因为它满足正态分布。 ( ) 31、两端假设检验中,否定域的大小为α。 ( ) 32、样本容量多少与研究容许的误差大小呈正比。 ( )
33、从同一总体中抽出的多个大样本的均值组成的数列满足正态分布。 ( ) 34、如果两个变量是呈相关关系,那么它们一定呈因果关系。( ) 35、在积矩相关分析结果r=0,则说明两变量不相关。 ( )
四、计算题
1.某工厂50名职工每周工资数分配情况如下表,试求:(1)算术平均;(2)中位数;(3)众数。
工资数(元) 60-62 人数 3 63-65 66-68 69-71 72-74 合计
10 20 13 4 50 2、某车间职工工资分布情况如下表,求该车间职工的平均工资,职工工资的中位数以及标准差。
按月工资分组 工人人数
3、某单位统计报表显示,人均月收入为3030元,为了验证该统计报表的正确性,作了共100人的抽样调查,样本人均月收入为3060元,标准差为80元,问能否说明该统计报表显示的人均收入的数字有误(取显著性水平α=0.05)。
4、某地区成人中吸烟者占75%,经过戒烟宣传之后,进行了抽样调查,发现了100名被调查的成人中,有63人是吸烟者,问戒烟宣传是否收到了成效?(α=0.05)
5、从某校随机地抽取81名女学生,测得平均身高为163厘米,标准差为6.0厘米,试求该校女生平均身高95%的置信区间。
6、对某市市民按老中青进行喜欢民族音乐情况的调查,样本容量为200人,调查结果示于下表,试把该频数列联表:①转化为相对频数的联合分布列联表②转化为相对频数的条件分布列联表;③指出对于民族音乐的态度与被调查者的年岁有无关系,并说明理由。 对于民族音乐的态度(Y) 年岁(X) 老 中 青 Σ 100-120 15 120-140 18 140-160 30 160-180 21 180-200 6 喜 欢 不喜欢 Σ
38 38 30 15 33 46 7、以下是婚姻美满与文化程度的抽样调查的结果,请计算婚姻美满与文化程度之Gamma系数。
文化程度 婚姻美满 美 满 一 般 不美满
8、两变量X、Y之间的关系如下表,
X Y 2 14 4 10 6 9 8 7 10 5 12 4 大学 9 8 3 中学 16 30 4 小学 5 18 7 (1)求回归方程;(2)求相关系数。 【Y=-0.957X+14.867】【r=0.98】
9、试就下表所示资料,计算关于身高和体重的皮尔逊相关系数。
N0 身高(厘米) 体重(千克)