《统计学第2版》2012年1月课程考试考前练习题(2)

2019-09-01 22:20

三、简答题

1. 试回答描述数据的集中趋势的统计量有哪些?并对这些统计量的特点加以比较。 解答:

常用的描述集中趋势的统计量主要有均值、中位数、众数。

(1)均值又分为算术平均数、调和平均数和几何平均数。未经分组整理的原始数据,其算术平均数的计算就是直接将一组数据的各个数值相加除以数值个数,称为简单算术平均数。根据分组整理的数据计算的算术平均数,就要以各组变量值出现的次数或频数为权数计算加权的算术平均数。

(2)调和平均数也称倒数平均数或调和均值。调和平均数和算术平均数在本质上是一致的,实际应用时,当计算算术平均数其分子资料未知时,就采用加权算术平均数计算均值,分母资料未知时,就采用加权调和平均数计算均值。

(3)几何平均数也称几何均值,通常用来计算平均比率和平均速度。

(4)中位数是将变量取值按大小顺序排列后,处于中间位置的那个变量值。中位数很好的代表了一组数据的中间位置,对极端值并不敏感。由于中位数只是数据中间位置的代表取值,因此中位数并没有利用数据的所有信息,其对原始数据信息的代表性不如均值。

(5)众数是指一组数据中出现次数最多的变量值。众数具有不唯一性。

均值、中位数、众数是描述数据集中趋势的主要统计量,它们按照不同的方法来确定,具有不同的特点和应用场合;但是,三者之间存在着一定的数量关系,这种数量关系取决于变量取值的频数分布状况。从分布的角度看,均值是一组数据全部数值的平均数,中位数是处于一组数据中间位置上的数值,众数始终是一组数据分布的最高峰值。对于具有单峰分布的大多数数据而言,均值、中位数、众数存在以下关系:

当变量取值的频数分布对称时,则均值与众数、中位数三者完全相等,即 当变量取值的频数分布呈现右偏时,三者之间的关系为 当变量取值的频数分布呈现左偏时,三者之间的关系为

x?Me?Mox?Me?Mox?Me?Mo;

; 。

从上面的关系我们可以看出,当频数分布呈对称分布或近似对称分布时,以均值、中位数或众数来描述数据的集中趋势都比较理想;当频数分布呈偏态时,极端值会对均值产生较大影响,而对众数、中位数没有影响,此时,用众数、中位数来描述集中趋势比较好。

均值不适用于定性数据。均值的优点在于它对变量的每一个取值都加以利用;缺点在于其统计量的稳健性较差,即容易受到极端值的干扰。对于偏态分布的数据,均值的代表性较差。因此,当数据分布的偏斜程度很大时,可以考虑选择中位数或众数作为集中趋势的代表。

2. 假设检验依据的基本原理是什么? 解答:

假设检验依据的基本原理是小概率原理。所谓小概率原理是指,若一个事件发生的概率很小,在一次试验中就几乎是不可能发生的。根据这一原理,如果在试验中很小概率的事件发生了,我们就有理由怀疑原来的假设是否成立,从而拒绝原假设。

3. 试回答相关分析与回归分析的区别。 解答:

相关分析描述的是变量之间的相关性。回归分析是一种应用极为广泛的数量分析方法,它用回归方程的形式描述和反映变量间的数量变换规律。对比相关分析,回归分析研究变量之间相互关系的具体形式,能从一个变量的变化来推测另一个变量的变化情况,为预测提供可能。

回归分析同相关分析的另一个区别是:相关分析假设变量之间的地位是等同的,不对变量进行区分;而在回归分析中则把变量区分为自变量和因变量。二者的地位不同,自变量通常被假设为非随机变量。

4. 一事件A的概率P(A)?0,能否肯定事件A是不可能事件?为什么? 解答:

不能肯定A是不可能事件。

不可能事件是指在同一组条件下每次试验都一定不出现的事件。而P(A)?0,并不能肯定A就是不可能事件。例如在闭区间?0,1?上随意投掷一点,显然该区间上任一点都可能被碰上,但每一点发生的概率都为0,因此概率为0的事件不一定都是不可能事件。

5. 试描述时间序列的分解步骤。 解答:

(1)图形描述。首先,通过对时间序列数据作图,观察它可能包含哪些变动,选择合适的分解模型。通过图形来判断时间序列是否含有长期趋势和季节变动成分。

(2)长期趋势的测定。对于含有长期趋势的时间序列,首先采用移动平均法剔除季节变动和不规则变动,再对得到的新时间序列拟合长期趋势。

(3)季节变动的测定。在时间序列的乘法模型中,季节变动是通过季节指数来估算的。季节指数可以描述现象由于受季节因素的影响偏离其总平均水平的相对程度。如果所分析的数据是月份数据,季节指数包括12个;如果是季度数据,季节指数包括4个。季节指数可以通过按季平均法得到。

(4)循环变动的测定。由于循环波动的周期长短不一、波动大小不同,且常与不规则运动交织在一起,很难单独对其估算,所以通常采用剩余法得到。剩余法是以时间序列的分解模型为基础,从时间序列中分离趋势变动、季节变动和不规则变动,从而得到循环波动。

四、计算题

1. 甲乙两班各有30名学生,统计学考试成绩如下: 考试成绩 优 良 中 差 人数 甲班 4 8 14 4 乙班 5 13 9 3 (1)根据表中的数据,制作甲乙两班考试成绩分类的对比条形图; (2)比较两班考试成绩分布的特点。 解答: 甲乙两班考试成绩人数1614121086420优良考试成绩 乙班学生考试成绩为优和良的比重均比甲班学生高,而甲班学生考试成绩为中和差的比重比乙班学生高。因此乙班学生考试成绩平均比甲班好。两个班学生都呈现出\两头小,中间大\的特点,即考试成绩为良和中的占多数,而考试成绩为优和差的占少数。

2. 为了解某银行营业厅办理某业务的办事效率,调查人员观察了该银行营业厅办理该业务的柜台办理每笔业务的时间,随机记录了15名客户办理业务的时间,测得平均办理时间t?12分钟,样本标准差s?4.1分钟,则: (1)其95%的置信区间是多少?

(2)若样本量为40,而观测的数据不变,则95%的置信区间是多少? 解答: 解:

(1)根据已知,有:

t0.025(14)?2.145甲班乙班中差,n?15,t?12,s?4.1。置信区间为

t?t0.025(14)

sn?12?2.145?4.115?[9.73,14.27]

(2)若样本量为n?40,则95%的置信区间为

t?z0.025

sn?12?1.96?4.140?[10.73,13.27]

3. 某企业某班组工人日产量资料如下:

日产量分组(件) 50-60 60-70 70-80 80-90 90-100 合计 工人数(人) 9 19 25 16 11 80

根据上表指出:

(1)上表变量数列属于哪一种变量数列; (2)上表中的变量、变量值、上限、下限、次数; (3)计算组距、组中值、频率。 解答:

(1)该数列是等距式变量数列。

60、70、80、90,70、80、90、100,19、25、16、11; (2)变量是日产量,变量值是50-100,下限是50、上限是60、次数是9、、23.75%、31.25%.20.75%。 65、75、85、95 ,频率分别是 11.25% (3)组距是10,组中值分别是55、

4. 某企业2008年各月末商品库存额资料如下: 月份 库存额(万元) 1 60 2 54 3 48 4 43 5 40 6 48 8 44 11 60 12 66 1月1日商品库存额为62万元。试分别计算上半年、下半年和全年的平均商品库存额。 解答: (1)上半年商品库存额: a1a6248?a2?a3???n?60?54?48?43?40?2?22?50(万元)a?2n?17?1 (2)下半年商品库存额: a?a3a?ana1?a2f1?2f2?L?n?1fn?1222a?f1?f2?L?fn?148?4444?6060?66?2??3??1222??51.83( )2?3?150?51.83?50.92( ) 2 (3)全年商品库存额:

5. 根据下表资料,计算众数和中位数

a?

按年龄分组 0—15 15—30 30—45 45—60 60以上 人口数(万人) 142 168 96 64 52

解答:

按年龄分组 0—15 15—30 30—45 45—60 60以上 合计 人口数(万人) 142 168 96 64 52 522 向上累计次数 142 310 406 470 522 向下累计次数 522 380 212 116 52 次数最多的是168万人,众数所在组为15-30这一组,故?1?168?142?26人?2?168?96?72人XL?15

,XU?30

,,

Mo?15?26?15?18.9826?72

Mo?XU?或:

?1168?96?d?30??15?18.98?1??2(168?142)?(168?96)?

中位数位置??f2522?2612,说明这个组距数列中的第262位所对应的人口年龄是中位数。从累计(两种方法)人口数中可见,

第261位被包括在第2组,即中位数在15~30组距内。 XL?15,

XU?30,

Sm?1?142,

Sm?1?212

?fMe?XL?或者:

2?Sm?1fm?d?15?261?142?15?25.625168

?fMe?XU?

2?Sm?1fm?d?30?261?212?15?25.625168

6. 一家调查公司进行一项调查,其目的是为了了解某市电信营业厅大客户对该电信的服务的满意情况。调查人员随机访问了30名去该电信营业厅办理业务的大客户,发现受访的大客户中有9名认为营业厅现在的服务质量比两年前好。试在95%的置信水平下对大客户中认为营业厅现在的服务质量比两年前好的比率进行区间估计。 解答: 解:

这是一个求某一属性所占比率的区间估计问题。已知

9?300。计算得

n?30,z??1.96,2??p根据抽样结果计算出的样本比率为

??z?p

2?(1?p?)p30%?(1?30%)??30%?1.96??(13.60%,46.40%)n30


《统计学第2版》2012年1月课程考试考前练习题(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:南京南站主站房结构设计概述

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: