《统计学》 第五版
《统计学》
考试题型:
1、单项选择题(20分,每题1分) 2、填空题(10分,每空1分) 3、简答题(20分,4题,每题5分)
4、分析计算题(50分,共4题,包括均值和方差等计算,参数估计,假设检验、回归分析、指数计算,要求携带计算器)
第一章 导论
? 统计学的概念
? 统计的2类方法:描述统计和推断统计
? 统计数据类型:(分类数据、顺序数据、数值型数据),(观察数据与实验数据),(截面数据与时
间序列数据)
? 数据测量的尺度:分类尺度、顺序尺度、间隔尺度、比率尺度 ? 总体与样本的概念,总体的确定
第二章 数据的搜集
? 概率抽样,简单随机抽样,分层抽样,整群抽样,系统抽样,抽样误差
第三章 数据的图表展示
? 条形图,直方图,两者之间的异同
第四章 数据的概括性度量
? 众数、中位数、平均数的概念及其应用范围、比较 ? 异众比率
? 均值与方差的计算,离散系数
第六章 统计量及其抽样分布
? 统计量的概念 ? 三个重要的抽样分布
? 样本均值、样本比例、样本均值之差、样本方差的抽样分布,中心极限定理,两个样本方差比的
抽样分布
第七章 参数估计
? 估计量的概念
? 点估计与区间估计,置信水平 ? 要求理解区间估计的原理 ? 估计量的评价标准
- 1 -
《统计学》 第五版
? 总体均值的区间估计问题
? 样本容量的确定,估计误差与样本容量、置信水平、总体方差等的关系
第八章 假设检验
? 原假设、备择假设,假设检验的步骤 ? 两类错误的概念 ? 假设检验的原理 ? P值决策
? 单侧检验的方向设定问题 ? 检验结论的解释
? 实际问题的检验(一个总体)
第十章 方差分析
? 方差分析的思想和原理 ? 误差分解 ? 自由度的确定
? 单因素方差分析,结果解释
第十一章 一元线性回归
? 相关关系(解决的问题、相关系数的特点) ? 回归分析(数据关系,结果解释,自由度确定问题) ? 判定系数,估计标准误差,
? 显著性检验(线性关系检验,回归系数显著性检验) ? 预测问题
第十二章 多元回归(公共事业管理专业)
与一元回归相同,注意差异
第十三 时间序列分析
时间序列含有的成分与分解,平滑方法的应用 增长率分析(增长率、平均增长速度,注意基本概念)
第十四章 指数
重点掌握加权综合指数(拉氏指数和帕氏指数)、加权平均指数的计算
- 2 -
《统计学》 第五版
一、 试述概率抽样的含义及其特点
概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。 特点:
① 抽样时是按一定的概率以随机原则抽取样本; ② 每个单位被抽中的概率是已知的或可以计算出来的;
③ 当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。
二、 简述方差分析中的基本假定
① 每个总体都应服从正态分布; ② 各个总体的方差σ2必须相同; ③ 观测值是独立的。
三、 相关分析主要解决哪些方面的问题
相关分析就是对两个变量之间线性关系的描述与度量。它解决的问题有: ① 变量之间是否存在关系? ② 如果存在关系,那是什么关系? ③ 变量之间的关系强度如何?
④ 样本所反映的变量之间的关系能否代表总体变量之间的关系?
四、 简述直方图和条形图的区别
① 条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的直方
图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义;
② 由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列; ③ 条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。
五、 回归分析主要解决哪些方面的问题
① 从一组样本数据出发,确定出变量之间的数学关系式;
② 对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量
的影响是显著的,哪些是不显著的;
③ 利用所求的关系式,根据一个或几个变量的取值来估计或预测另一个特定变量的取值,并给出这
种估计或预测的可靠程度。
六、 举例说明统计量的定义
对原始数据进行一定的运算,以算出某些代表性的数字,足以反映数据某些方面的特征,这种数据称为统计量。
设X1,X2,…,Xn是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数T(X1,X2,…,Xn),不依赖于任何未知参数,则称函数T(X1,X2,…,Xn)是一个统计量。
- 3 -
《统计学》 第五版
七、 简述线性相关系数的特点
① 相关系数r取值范围为[-1,1],即–1≤r≤+1,若0<r≤1,表示x与y之间存在正线性相关关
系;若-1≤r<0,表示x与y之间存在负线性相关关系;若r=1,表示x与y之间存在完全正线性相关关系;若r=-1,表示x与y之间存在完全负线性相关关系;若r=0,表示两变量之间不存在线性相关关系。 ② r具有对称性,即rxy=ryx;
③ r的数值大小与x和y的原点及尺度无关;
④ r仅仅是x与y之间线性关系的一个度量,它不能用于描述非线性关系;
⑤ r虽然是两个变量之间线性关系的一个度量,但不一定意味着x与y一定有因果关系。
八、 简述假设检验中P值的含义
如果原假设H0是正确的,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值。P值是假设检验中的另一个决策工具,对于给定的显著性水平α,若P<α,则拒绝原假设。
九、 简述众数、中位数和均值的特点及应用场合
① 众数是一组数据中出现次数最多的变量值,用M0表示。众数主要用于测度分类数据的集中趋势,
当然也适用于作为顺序数据以及数值型数据集中趋势的测度值。一般情况下,只有在数据量较大的情况下,众数才有意义。
② 中位数是一组数据排序后处于中间位置上的变量值,用Me表示。中位数主要用于测度顺序数据
的集中趋势,当然也适用于测度数值型数据的集中趋势,但不适用于分类数据。
③ 均值是一组数据相加后除以数据的个数得到的结果。均值主要适用于数值型数据,但不适用于分
类数据和顺序数据。
十、 简述样本容量与置信水平、总体方差和估计误差的关系
① 样本量与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需的样本量也就越大; ② 样本量与总体方差成正比,总体的差异越大,所要求的样本量也越大;
③ 样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量就越小。
十一、 简述假设检验的步骤
① 首先提出原假设和备择假设; ② 需要确定适当的检验统计量; ③ 进行统计决策。
十二、 简述中心极限定理的内容
从均值为μ、方差为σ2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n≥30),样本均值μ的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。
- 4 -
《统计学》 第五版
模拟试题一
一. 单项选择题(每小题2分,共20分)
1. 一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均花费是200元,他们
选择在网上购物的主要原因是“价格便宜”。这里的参数是( )
A. 1000个消费者 B. 所有在网上购物的消费者
C. 所有在网上购物的消费者的平均花费额 D. 1000个消费者的平均花费金额
2. 为了调查某校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,
这种抽样方法属于( )
A. 简单随机抽样 B. 整群抽样 C. 系统抽样 D. 分层抽样
3. 某班学生的平均成绩是80分,标准差是10分。如果已知该班学生的考试分数为对称分布,可以
判断考试分数在70到90分之间的学生大约占( ) A. 95% B. 89% C. 68% D. 99%
4. 已知总体的均值为50,标准差为8,从该总体中随机抽取容量为64的样本,则样本均值的数学
期望和抽样分布的标准误差分别为( )
A. 50,8 B. 50,1 C. 50,4 D. 8,8
5. 根据某班学生考试成绩的一个样本,用95%的置信水平构造的该班学生平均考试分数的置信区间
为75分~85分。全班学生的平均分数( )
A.肯定在这一区间内 B.有95%的可能性在这一区间内
C.有5%的可能性在这一区间内 D.要么在这一区间内,要么不在这一区间内
6. 一项研究发现,2000年新购买小汽车的人中有40%是女性,在2005年所作的一项调查中,随机
抽取120个新车主中有57人为女性,在??0.05的显著性水平下,检验2005年新车主中女性
的比例是否有显著增加,建立的原假设和备择假设为( )
A.H0:??40%,H1:??40% B.H0:??40%,H1:??40% C.H0:??40%,H1:??40% D.H0:??40%,H1:??40%
7. 在回归分析中,因变量的预测区间估计是指( )
A. 对于自变量x的一个给定值x0,求出因变量y的平均值的区间 B. 对于自变量x的一个给定值x0,求出因变量y的个别值的区间 C. 对于因变量y的一个给定值y0,求出自变量x的平均值的区间 D. 对于因变量y的一个给定值y0,求出自变量x的平均值的区间
8. 在多元线性回归分析中,如果F检验表明线性关系显著,则意味着( )
A. B. C. D.
在多个自变量中至少有一个自变量与因变量之间的线性相关系著 所有的自变量与因变量之间的线性关系都显著
在多个自变量中至少有一个自变量与因变量之间的线性关系不显著 所有的自变量与因变量之间的线性关系都不显著
9. 如果时间序列的逐期观察值按一定的增长率增长或衰减,则适合的预测模型是( )
- 5 -