1.最近的医学研究表明,有一种叫“佳乐宁”的物质会影响人们对高脂肪食物的需求,一个人脑内所产生的这种物质愈多,想吃高脂肪食物的欲望就越高。近来,有一家制药公司在研制一种实验药物以阻断“佳乐宁”的产生或传导,又不能影响对健康食物的食欲。该公司一位神经学科学家相信此药物在控制肥胖上将会非常有效,并相信每日规律地服用此药将导致体重下降。于是展开一项实验,随机抽取15位志愿的肥胖女性并提供6个月的药量,分别记录每位受试者实验开始和结束后的体重。数据如下:
受试者编号 试前体重(磅) 试后体重(磅) 1 165 145 2 143 137
3 175 170 · · · · · ·
· · · 15 169 154
对此数据分别用Excel和SPSS进行分析,结果如下(显著性水平为0.05): 表4.1.1 Excel运算结果 平均值 方 差 观测值 假设平均差 df(自由度) t Stat(t值) P值(单尾) t 单尾临界值 P(值(双尾) t 双尾临界值 受试前体重 162.07 259.35 15 0 14 7.71 0.000 1.76 0.000 2.14 受试后体重 150.27 237.92 15 表4.1.2 SPSS运算结果
要求:根据上述资料回答下列问题:
(1)上述简单统计推断分析的是( )。
A.单总体均值检验 B.成对样本均值的检验 C.来自两个总体的独立样本均值的检验
(2)根据检验目的,写出原假设和备择假设,并说明各自的含义。
(3)根据样本统计量的计算结果和相应显著性水平的临界值的对比,说明检验结果和理由。
(4)根据上述P值,说明检验结果和理由。
(5)写出受试前与受试后体重差的95%的置信区间。
2. 十六个不同的零食所含卡路里数据如下图所示(单位:卡):
热量茎叶图
Frequency Stem & Leaf 1.00 11 . 2 2.00 11 . 88 5.00 12 . 33344 2.00 12 . 88 1.00 13 . 2 1.00 13 . 6 1.00 14 . 2 3.00 Extremes (>=164) Stem width: 10 Each leaf: 1 case(s)
(1)求出该组数据的众数和中位数;
(2)说明均值、众数、中位数哪一个更具有代表性?说明理由。
3.一家电话公司制订出一个广告计划,以增加客户长途电话的通话时间。为了解该计划的优
点,公司对其进行小规模推广试验,他们从推广目标客户中随机抽取100位客户作为样本,并记录这100位客户在过去一个月长途电话的通话时间,然后公司在接下来的一个月里,在给用户的声明中加上一份特殊的广告传单,然后再记下这些客户该月的通话时间,数据如下表所示(分钟)。
客户 1 2 3 ?? 100 加入广告传单前 92 304 48 ?? 217 加入广告传单后 129 249 214 ?? 487 运用Excel对以上样本数据进行分析,分析结果如下: 描述统计结果 推广后 均值 202.68 N 100 标准差 147.106 均值的标准误差 14.711 推广后 推广前
均值 202.68 171.89 N 100 100 标准差 147.106 133.051 均值的标准误差 14.711 13.305 推广后-推广前均值差的检验结果
均值之差的95%置信区间 标准差 68.41 标准误 Lower 30.79 6.84 17.22 Upper 44.36 t 4.50 自由度 99 双侧P值 .000 d 注:d为推广前后样本数据之差di的均值 试根据上述结果回答以下问题(本题共12分)
(1)公司对同一组客户测量他们前后的反应,这属于什么类型的样本?这样做的好处是什么?
(2)公司是否可以认为,给用户的声明中加上一份特殊的广告传单对于提高用户长途电话的通话时间是有帮助的?请写出对应的原假设、备择假设及其含义,并给出检验结果及理由。
(3)给出广告传单推广后比推广前其用户长途电话的平均通话时间之差的95%的置信区间,并简要说明其含义。
4.为了研究地理位置对商场销售额影响,研究者分别调查了商业街(9家)、居民区(7家)、CBD(8家)和开发区(7家)共31家零售商,调查得人均月销售额数据如下表所示:
不同位置商场人均月销售额 单位:万元/人
1 2 3 4 5 6 7 8 9 样本 编号 商业街 21 25 18 18 16 24 28 22 24 地理位置 居民区 CBD 11 18 9 16 15 24 16 18 18 15 20 18 16 16 - 10 - 开发区 12 15 20 9 14 16 10 - -
利用Excel分析结果如下: 差异源 离差平方和 自由度 组间 组内 总计 308.3344 401.8591 710.1935 均方 F —— —— P值 0.00134 —— —— F (??0.05临界值) 2.960351 —— —— 27 30 —— 要求:
(1)根据已知资料,填出上述表中空白格的数字
(2)写出上述分出方差分析的原假设和备择假设,并说明其含义 (3)说明分析结果,并说明理由
5.为了研究初中成绩与高中成绩的关系,随机抽查50名高一学生,登记其初三成绩与高一成绩,并利用SPSS统计软件进行一元线性回归分析,结果输出如下:
判定系数R(相关系数).795判定系数.632修正后判定系数.625估计标准误差7.22091 方差分析回归平方和残差平方和总计离差平方和4307.2062502.7946810.000自由度14849均方4307.20652.142F值82.606P值.000 回归系数回归系数常数项初三成绩B26.444.651标准误5.396.072t值4.9019.089P值.000.000 试根据以上结果回答以下问题:
(1)说明学生初三成绩与高一成绩之间的相关关系的形态; (2)写出估计的回归方程并解释回归系数的实际含义; (3)对上述拟合的回归方程进行评价。
6.为研究少年儿童成长发育状况,某研究所的A调查人员在某城市抽取100名7——17岁的少年儿童作为样本,B调查人员则抽取了1000名7——17岁的少年儿童作样本,请回答以下问题,并解释。
(1)哪一位调查研究人员在其所抽取的样本中得到的少年儿童的平均身高较高?或者这两组样本的平均身高相同。
(2)哪一位调查研究人员在其所抽取的样本中得到的少年儿童的身高标准差较大?或者这两组样本身高的标准差相同。
(3)哪一位调查研究人员有可能得到这1000名少年儿童的最高者或最低者?对两位研究人员来说这种机会是相同的吗?
7.某关于居民收入的研究报告将居民按收入高低划分为高收入组(上四分位数以上者)、较高收入组(介于中位数与上四分位数之间者)、较低收入组(下四分位数与中位数之间者)和低收入组(低于下四分位数者),报告称,今年低收入组人群比重较去年有明显下降,说明居民收入有所提高。请从统计学角度指出该报告中有何错误?为什么?
8. 美国洛杉矶湖人队2000年14名球员的薪水(百万美元)如下表:
球 员 奥尼尔 布莱恩特 霍利 赖斯 费希尔 福克斯 奈特 薪 水 17.1 11.8 5 4.5 4.3 4.2 3.1 球 员 哈伯 格林 乔治 肖 萨利 卢 塞莱斯坦
薪水茎叶图
薪 水 2.1 2 1 1 0.8 0.7 0.3
为了确定新年度球员薪水水平,球员工会与老板进行谈判。球队老板计算了14名球员的平均收入,其数值为410多万美元,老板觉得球员薪水太高了,不能再提高了。而球员工会代表主张用中位数分析球员薪水水平,并绘制了茎叶图以支持自己的说法。
要求:请说明球队老板和球员工会代表的争执原因是什么?你认为谁的主张更合理?为什么?
9. 对2006年下列31个省市进行分析,调查得到各省市人均GDP等6个指标,各省市编号如下表4.3.1:
表4.3.1 省份编号 省份 编号 省份 编号 省份 编号