统计学模拟考试
一、单选题(20小题,每题1分,计20分)
1、在关于工业企业的调查中,有一个调查项目为“经济类型”,企业经济类型分为“国有企业”、“集体企业”等,则变量“经济类型”是( )
A、定量变量 B、数值变量 C、分类变量 D、顺序变量
2、调查人员欲以统计图形展示企业产品的品种构成,则适用的统计图为( ) A、饼图 B、直方图 C、箱线图 D、茎叶图
3、从100000个家庭中用简单随机抽样方法抽取1000个家庭做样本,设Xi为第i个家庭的人数,?表示总体平均数、x表示样本的数学期望,则E(x)与?的关系是( )
A、一定相等 B、在大多数情况下相等 C、偶尔相等 D、一定不相等
4、依据多样本箱线图判断比较中位数的大小
(此原题需要画箱线图,电脑上没有适当数据,不便画,谨列出考点,请大家理解)
5、下面说明数据水平的统计量中使用面最广的是( )
A、众数 B、中位数 C、均值 D、分位数
6、在下列数据中,可以计算中位数的是( )
A、居民的家庭住址 B、企业所属行业 C、产品类别 D、产品质量等级 7、某企业职工平均工资为2000元,方差为1600元,某职工工资为2048元,则该职工工资的标准分为( ) A、0.03 B、0.8 C、1.2 D、-1.2
8、从所研究的总体中随机抽取的一个大样本,则样本均值近似服从( )
A、正态分布 B、卡方分布 C、T分布 D、F分布
9、为研究北京市城镇居民的收入状况,在北京市城镇居民中随机抽取800户进行调查,计算得到其户月均收入为4180元,请问户均收入属于( )
A、参数 B、统计量 C、估计值 D、样本容量
10、在给定的显著性水平下,进行假设检验,确定拒绝域的依据是( ) A、原假设为真的条件下检验统计量的概率分布 B、备择假设为真的条件下检验统计量的概率分布 C、原假设为真的条件下总体的概率分布 D、备择假设为真的条件下总体的概率分布
11、要求估计量的数学期望等于被估计的总体参数,这一标准被称为( ) A、一致性 B、无偏性 C、有效性 D、充分性
?12、如果?是某总体参数?的一致估计量,则随着样本容量n的增大,有( ) ???A、?的数值接近总体参数 B、?的期望等于总体参数?
C、?的方差接近总体参数? D、?的方差接近总体参数?
13、在假设检验中,第一类错误是指( )
A、原假设为真,不拒绝原假设 B、原假设为真,拒绝原假设 C、原假设为假,拒绝原假设 D、原假设为假,不拒绝原假设
14、在一元线性回归模型y??0??1x??中,?反映的是( )
A、x变化引起y的线性变化部分 B、y变化引起x的线性变化部分
C、x与y的线性关系对y的影响 D、除x与y的线性关系之外的随机因素对y的影响
15、在一元线性回归分析中,如果估计标准误差为0,则意味着( )
A、回归系数为0 B、回归系数绝对值为1 C、判定系数为1 D、相关系数为0
16、方差分析对数据有三个基本假定,下列各项中不属于这三个假定的是( ) A、正态性 B、方差齐性 C、独立性 D、无偏性
17、时间序列中,在一年内重复出现的固定周期的周期性波动称之为( )
A、短期趋势 B、循环波动 C、季节波动 D、随机波动
18、将最近K期的每个观测值都给予相同权数进行预测的时间序列预测法称之为( ) A、回归法 B、移动平均法 C、指数平滑法 D、最小平方法
19、聚类分析的基本原则是( )
A、类间差异小,类内差异大 B、类间差异小,类内差异小 C、类间差异大,类内差异小 D、类内差异与类间差异均大
20、主成分分析的主要作用是( )
A、分析数据的平均水平 B、分析数据的波动程度 C、对数据标准化 D、对数据降维
二、多选题(5小题,每题2分,计10分)
1、 下列各项中,能够反映数据水平且比较稳健的有( )
A、均值 B、分位数 C、中位数 D、标准差 E、众数
2、以下关于统计量的标准误差描述中正确的是( ) A、统计量的标准误差是指样本统计量的标准差 B、标准误差用于衡量样本统计量的离散程度
C、统计量的标准误差是用于衡量样本统计量与总体参数之间差距的一种尺度 D、标准误差是根据一个样本统计量计算出来的
E、标准误差是根据理论上的所有可能样本统计量计算出来的
3、时间序列的构成要素包括有( )
A、长期趋势 B、季节变动 C、循环变动 D、不规则波动 E、时间
??24、关于一元线性回归模型的判定系数R的说法中,正确的有( ) A、R是回归平方和与总平方和的比值 B、R=0,说明变量间不存在线性依存关系 C、R=1,说明变量间不存在线性依存关系 D、R越接近1,说明回归方程拟合优度越高 E、R越接近1,说明回归方程拟合优度越低
5、在假设检验中,当我们做出拒绝原假设的结论时,表示( ) A、有充足的理由否定原假设 B、原假设必定是错误的
C、犯错误的概率不大于显著性水平? D、犯错误的概率不大于第二类错误的概率? E、在H0为真的假设下可能发生了小概率事件
三、简答题(2小题,每题10分,计20分)
1、美国洛杉矶湖人队2000年14名球员的薪水(百万美圆)如下表: 球员 奥尼尔 布莱恩特 霍利 赖斯 费希尔 福克斯 奈特 薪水 17.1 11.8 5 4.5 4.3 4.2 3.1 球员 哈伯 格林 乔治 肖 萨利 卢 塞莱斯坦 薪水 2.1 2 1 1 0.8 0.7 0.3 222222为确定新年度球员薪水水平,球员工会与老板进行谈判。球队老板计算了14名球员的平均收入,其数值为410多万美圆,老板觉得球员薪水已经很高,不能再提高了。而球员工会代表主张用中位数分析球员薪水水平。要求:
(1)请计算14名球员薪水的中位数
(2)说明球队老板和球员工会代表争执原因是什么?谁的主张更合理?为什么?
2、某大学教授喜欢游泳,他记录了每次游2000米所用的时间(分钟)和游完泳后的脉搏次数,共记录了23次。该教授分析了时间与脉搏之间的关系,计算得到二者的相关系数为-0.74598,线性回归方程为:脉搏=479.9-9.695*时间,他对相关系数和回归方程进行了统计检验,结果表明在0.05的显著性水平下均显著。要求:
(1)结合上面资料,说明该教授游泳时间与脉搏次数的关系
(2)本周末该教授游2000米用时34.3分钟,请利用上面回归方程预测他游完时的脉搏次数。该教授实际上游完时的脉搏次数为152,你的预测与实际数一致吗?应怎样理解两者之间的差异?
四、计算分析题(3小题,计50分)
1、简单统计推断(17分)
最近的一项医学研究表明,有一种叫“佳乐宁”的物质会影响人们对高脂肪事物的需求,一个人脑内所产生的这种物质越多,则想吃高脂肪食物的欲望越强。近来,有一家制药公司在研制一种实验药物以阻断“佳乐宁”的产生和传导,又不能影响对健康食物的食欲。该公司一位神经学家相信此药物在控制肥胖上将会非常有效,并相信每日规律性地服用此药将导致体重下降。于是展开一项实验,随机抽取15位志愿的肥胖女性并提供6个月的药量,分别记录每位受试者实验开始和结束后的体重,处理分析的数据表现如下: EXCEL分析: 平均值 方差 观测值 假设平均差 df(自由度) t Stat(t值) P值(单尾) t单尾临界值 P值(双尾) 受试前体重 162.07 259.35 15 0 14 7.71 0.000 1.76 0.000 受试后体重 150.27 237.92 15 t双尾临界值 SPSS分析: Mean Std Deviation Std error Mean 2.14 t值 df Sig(2-tailed) 95% Confidence Interval of the Difference Lower 8.51 11.8 5.93 1.53 Upper 15.08 7.71 14 0.000 根据以上资料,要求:
(1)上述简单统计推断分析的是( )
A、单总体均值检验 B、成对样本均值的检验 C、来自两个总体的独立样本均值的检验 (2)根据检验目的,写出原假设和备择假设,并说明各自的含义
(3)根据样本统计量的计算结果和相应显著性水平的临界值的对比,说明检验结果和理由 (4)根据上述P值,说明检验结果和理由
(5)写出受试前与受试后体重差的95%的置信区间
2、主成分分析(15分)
为评价全国各省、直辖市、自治区的综合发展水平,现收集了全国24个地区的人均GDP、人均可支配收入、人均消费支出等数据进行综合考察。并利用主成分分析方法对各地区综合发展状况进行评价,分析结果如下:
特征值及方差贡献率: 成分 1 2 3 4 5 6 7 初始特征值 4.725 1.234 0.449 0.306 0.214 0.061 0.011 方差贡献率 67.507 17.633 6.409 4.373 3.054 0.865 0.158 累积方差贡献率 67.507 85.141 91.550 95.923 98.977 99.842 100.000