56、【104262】(简答题)试回答描述数据的集中趋势的统计量有哪些?并对这些统计量
的特点加以比较。
【答案】常用的描述集中趋势的统计量主要有均值、中位数、众数。
(1)均值又分为算术平均数、调和平均数和几何平均数。未经分组整理的原始数据,其算术平均数的计算就是直接将一组数据的各个数值相加除以数值个数,称为简单算术平均数。根据分组整理的数据计算的算术平均数,就要以各组变量值出现的次数或频数为权数计算加权的算术平均数。
(2)调和平均数也称倒数平均数或调和均值。调和平均数和算术平均数在本质上是一致的,实际应用时,当计算算术平均数其分子资料未知时,就采用加权算术平均数计算均值,分母资料未知时,就采用加权调和平均数计算均值。
(3)几何平均数也称几何均值,通常用来计算平均比率和平均速度。
(4)中位数是将变量取值按大小顺序排列后,处于中间位置的那个变量值。中位数很好的代表了一组数据的中间位置,对极端值并不敏感。由于中位数只是数据中间位置的代表取值,因此中位数并没有利用数据的所有信息,其对原始数据信息的代表性不如均值。
(5)众数是指一组数据中出现次数最多的变量值。众数具有不唯一性。
均值、中位数、众数是描述数据集中趋势的主要统计量,它们按照不同的方法来确定,具有不同的特点和应用场合;但是,三者之间存在着一定的数量关系,这种数量关系取决于变量取值的频数分布状况。从分布的角度看,均值是一组数据全部数值的平均数,中位数是处于一组数据中间位置上的数值,众数始终是一组数据分布的最高峰值。对于具有单峰分布的大多数数据而言,均值、中位数、众数存在以下关系:
当变量取值的频数分布对称时,则均值与众数、中位数三者完全相等,即 当变量取值的频数分布呈现右偏时,三者之间的关系为
x?Me?Mox?M?Mx?Me?Mo;
;
eo。 当变量取值的频数分布呈现左偏时,三者之间的关系为
从上面的关系我们可以看出,当频数分布呈对称分布或近似对称分布时,以均值、中位数或众数来描述数据的集中趋势都比较理想;当频数分布呈偏态时,极端值会对均值产生较大影响,而对众数、中位数没有影响,此时,用众数、中位数来描述集中趋势比较好。
均值不适用于定性数据。均值的优点在于它对变量的每一个取值都加以利用;缺点在于其统计量的稳健性较差,即容易受到极端值的干扰。对于偏态分布的数据,均值的代表性较差。因此,当数据分布的偏斜程度很大时,可以考虑选择中位数或众数作为集中趋势的代表。
57、【104263】(简答题)试回答描述数据的离散趋势的统计量有哪些?并对这些统计量
的特点加以比较。
【答案】离散趋势反映了变量各个取值远离其中心值的程度。常用的测度离散程度的统计量主要有异众比率、极差、四分位差、平均差、方差、标准差和离散系数等。
(1)异众比率是指一组数据中非众数(组)的频数占总频数的比例,是衡量众数对一组数据的代表性程度的指标。异众比率越大,说明非众数组的频数占总频数的比重就越大,众数的代表性就越差;反之,异众比率越小,众数的代表性就越好。
(2)极差是一组数据的最大值与最小值之差,也称全距,主要用于测度顺序数据和定量数据的离散趋势。极差容易受极端值的影响。
(3)四分位差是上四分位数与下四分位数之差。四分位数是指处在25%位置上的数值(下四分位数)和处在75%位置上的数值(上四分位数)。四分位差主要用于测度顺序数据和定量数据的离散趋势,它克服了极差容易受数据中两端极值的影响这一缺陷。数值越小,说明中间的数据越集中;数值越大,说明中间的数据越分散。
(4)平均差是一组数据与其均值离差绝对值的平均数。平均差越大,说明数据的离散趋势越大;平均差越小,说明数据的离散趋势越小。但是,由于平均差是用绝对值进行运算的,它
不适宜于代数形式处理,所以在实际应用上受到很大的限制。
(5)方差是一组数据与其均值离差平方的算术平均数。标准差是方差的平方根。方差、标准差同平均差一样,也是根据全部数据计算的,能够准确地反映每个数据与其均值的平均差异程度。但方差、标准差是取离差的平方消除正负号,这更便于数学上的处理。
(6)离散系数是一组数据的标准差与其均值之比,又称变异系数。主要用于比较不同样本数据的离散程度,其数值越大,说明数据的离散程度越大。
58、【104254】(填空题)描述数据的离散趋势的统计量主要有异众比率、极差、四分位
差、平均差、_____、标准差、_____。 【答案】方差、离散系数
59、【104255】(填空题)描述数据的集中趋势的统计量主要有_____、_____、_____。 【答案】均值、中位数、众数
60、【104256】(填空题)当变量取值的频数分布呈现左偏时,均值、中位数、众数三者
之间的关系为:_____。
【答案】均值<中位数<众数
61、【104258】(填空题)平均发展速度和平均增长速度之间的数量关系式是:_____。 【答案】平均增长速度=平均发展速度-1
62、【104275】(计算题)设某产品的完整生产过程包括3道流水作业的连续工序,这3道
生产工序的产品合格率分别为80%、90%和95%。则整个生产流程的产品总合格率是多少?
33 【答案】0.8?0.9?0.95?0.684?88.1%
63、【145013】(计算题) 某学院一年级两个班的学生高等数学考试成绩如下表:
高等数学考试成绩 50~60 60~70 70~80 80~90 90~100 合计 学生人数 甲班 2 5 10 17 6 40 乙班 4 7 14 18 7 50
试分别计算两个班的平均成绩和标准差,并比较说明哪个班的高等数学考试成绩差异程度更大。
【答案】
高等数学考试成绩 50~60 60~70 70~80 80~90 90~100 合计 组中值x 55 65 75 85 95 — 5甲班f 2 5 10 17 6 40 乙班f 4 7 14 18 7 50 甲班xf 110 325 750 1445 570 3200 乙班xf 220 455 1050 1530 665 3920
x甲?i?15?xifi?i?1甲班成绩均值:甲班成绩标准差:
i?1?fi3200?8040
??xi?x甲?i?152fi?s甲??55?80?2?2??65?80?2?5??75?80?2?10??85?80?2?17??95?80?2?640s甲x甲10.62?0.132880?fiV甲??5?10.62
甲班成绩离散系数:
乙班成绩均值:
x乙?i?15?xifi?i?15?fi53920?78.450乙班成绩标准差:
s乙?i?1
??xi?x乙?i?12fi??55?78.4?2?4??65?78.4?2?14??85?78.4?2?18??95?78.4?2?750?fiV乙?s乙x乙?11.36?0.144978.45?11.36
乙班成绩离散系数:
V甲?V乙
,因此,乙班的高等数学考试成绩差异更大。
64、【145019】(计算题)根据下表资料,计算众数和中位数。
按年龄分组 0—15 15—30 30—45 45—60 60以上 人口数(万人) 142 168 96 64 52
【答案】按年龄分组 0—15 15—30 30—45 45—60 60以上 合计 人口数(万人) 142 168 96 64 52 522 向上累计次数 142 310 406 470 522 XL?15XU?30向下累计次数 522 380 212 116 52
次数最多的是168万人,众数所在组为15~30这一组,故
?1?168?142?26人,
,
?2?168?96?72人,
Mo?XL?Mo??126?d?15??15?18.98?1??226?72?272?d?30??15?18.98?1??226?72或:
中位数位置??f2?522?2612,说明这个组距数列中的第262位所对应的人口年龄是中位数。从累fm?168计(两种方法)人口数中可见,第261位被包括在第2组,即中位数在15~30这组中。
XL?15,
XU?30,,
Sm?1?142,
Sm?1?212
?fMe?XL?2?Sm?1fm?d?15?261?142?15?25.625168或者:
?fMe?XU?2?Sm?1fm?d?30?261?212?15?25.625168 65、【145089】(计算题) 有甲乙两个生产小组,甲组平均每个工人的日产量为32件,
标准差为8件。乙组工人日产量资料如下: 日产件数 10-20 20-30 30-40 40-50 工人数(人) 25 38 34 12
要求:(1)计算乙组平均每个工人的日产量和标准差。
(2)比较甲、乙两生产小组哪个组的日产量差异程度大?
【答案】(1)
x乙?i?14?xifi?i?144?fi15?25?25?38?35?34?45?12?28.0325?38?34?12
2s乙?i?1??xi?x甲?i?1fi??15?28.03?2?25??25?28.03?2?38??35?28.03?2?34??45?28.03?2?1225?38?34?12?fis甲x甲?8?0.25324?9.43
V甲?(2)
V乙?s乙x乙?
说明乙组日产量差异程度大于甲组。
9.43?0.3428.03
66、【163301】(计算题)某年度两家工厂采购同一种原材料的价格和批量情况如下
表。试分别计算这两个厂的平均采购价格。 采购单价(元/吨) 700 725 755 770 780 合计 采购金额(万元) 甲工厂 115 106 82 52 45 400 乙工厂 100 100 100 100 100 500
x甲?i?15mi?mi?5 【答案】
x乙?x甲?i?15mii?1xi?115?106?82?52?45400??740.741150.54?106?82?52?45700725755770780(元/吨)
?mi?5i?1xi?100?100?100?100?100500??746.271001000.67?100?100?100700725755770780(元/吨)
67、【173857】(计算题)某农场在不同自然条件的地段上用同样的管理技术试种两
个粮食新品种,有关资料如下表所示: