学号: 班级: 姓名:
对于配偶情况,有配偶的占85%,未婚的占8%。
2.6.4 为了解某特定商品房型的价格变动情况,某市调查机构随机抽取了25个样本,得销售价格资料如下:
销售价格(单位:元)
5660 5899 5710 6090 5425
5595 6295 5950 5770 5367
6060 5749 5720 5682 6380
5500 5820 5575 6016 5945
5630 5843 5760 5650 6120
要求:试根据上表资料绘制茎叶图。 解:
销售价格茎叶图为: 树茎 53 54 55 56 57 58 59 60 61 62 63 67 25 007595 30506082 1020496070 204399 4550 166090 20 95 80 树叶 数据个数 1 1 3 4 5 3 2 3 1 1 1
2.6.5 D超市30天的销售额资料如下(单位:万元):
59 40 56 36
63 67 42 56
35 65 64 69
41 46 57 63
92 45 43 54
63 84 64 72
11
学号: 班级: 姓名:
53
64
31
70
51
78
要求:试根据上表资料进行数据分组,并绘制这组数据的频数直方图。 解: 将数据分为7组,组距为10。
频数分布表
按销售额分组(万元)
30-40 40-50 50-60 60-70 70-80 80-90 90-100 合计
频率 4 5 7 9 3 1 1 30
百分比(%)
13.3 16.7 23.3 30.0 10.0 3.3 3.3 100.0
直方图:
108642020-3030-4040-5050-6060-7070-8080-9090-100100-110
2.6.6 2006年世界十大富豪和中国内地十大富豪资产的资料如下: 世界(亿美元) 姓名 比尔·盖茨 沃伦·巴菲特 卡洛斯·贺鲁 英格瓦·坎普拉德 拉克什米·米塔尔 保罗·艾伦 伯纳德·阿诺特 阿尔瓦利德·塔拉尔 肯尼斯·汤姆森家族 李嘉诚 资产 500 420 300 280 235 220 215 200 196 188 中国内地(亿元人民币) 姓名 黄光裕 许荣茂 荣智健 朱孟依 张 茵 张 力 施正荣 刘永行 郭广昌 鲁冠球 资产 180.9 173.6 158 152.4 115 115.2 113 91.7 90.8 90.5 要求:试按照1美元=7元人民币的汇率,画出相应的对比柱形图和环形图。 解:
12
学号: 班级: 姓名:
对比柱形图
世界十大富豪和中国内地十大富豪资产柱形对比图600500400亿美元30020010001234567891011系列1系列2
(系列1为世界十大富豪,系列2为中国内地十大富豪) 环形图:
世界十大富豪和中国内地十大富豪资产环形图12.9312.9713.119620018825.8450024.842016.1421522016.4623516.4330022.5728021.7712345678910
2.6.7 试通过对次级资料的收集,绘制1990—2006年我国国内生产总值(GDP)的线图,(按当年价格计算,单位:亿元)。
解:
1990—2006年我国国内生产总值(GDP)的线图
1990—2006年我国国内生产总值(GDP)250000200000150000100000500000 总值19901991199219931994199519961997199819992000200120022003200420052006年份 2.6.8 某大型乳制品加工企业2006年在全国4个大区的销售额如下(单位:百万元):
月份 1 2 3 4 5 6 华北 110 115 107 105 101 99 华东 160 160 174 189 192 140 华中 81 82 76 77 80 77 华南 62 68 70 71 69 73
13
学号: 班级: 姓名:
7 8 9 10 11 12 96 100 108 113 125 129 154 170 177 188 151 179 76 69 66 75 89 95 78 77 89 92 95 98 要求:试根据上表资料绘制箱线图,并分析各大区销售额的分布特征。 解:
如图所示,华东地区的平均销售额最高,其次是华北地区,较低的是华中地区,排最后的是华南地区;从销售额分布的离散程度来说,华中地区(有两个离异点)和华南地区的销售额较为集中,,华北和华东地区的销售额则比较分散。
14
学号: 班级: 姓名:
第三章 数据分布特征的描述
一、填空题
3.1.1 集中趋势 是指一组数据向其中心值靠拢的倾向。 3.1.2 加权算术平均数受两个重要因素的影响,一个是 各组变量值 ;另一个是各组变量值出现的 频数或频率 。
3.1.3 计算比率的平均数时,如果已知比率及其基本计算式的分母资料,则采用 加权算术平均法 。
3.1.4 计算比率的平均数时,如果已知比率及其基本计算式的分子资料,则采用 加权调和平均法 。
3.1.5 几何平均法 是计算平均比率或平均发展速度最适用的一种方法。 3.1.6 众数 是指一组数据中出现次数最多的变量值。
3.1.7 四分位数 是指将按大小顺序排列的一组数据划分为四等分的三个变量值。 3.1.8 十分位数 是指将按大小顺序排列的一组数据划分为10等分的9个变量值。 3.1.9 在数据分布呈 完全对称的正态分布 时,算术平均数、众数和中位数三者相等。 3.1.10 异众比率是指 非众数组 的频数占总频数的比率。
3.1.11 上四分位数与下四分位数之差的简单算术平均数称为 四分位差 。 3.1.12 各个变量值与其算术平均数离差的绝对值的平均数称为 平均差 。
3.1.13 总体方差是各个数据与其 算术平均数 的离差平方的平均数,通常以?2表示。 3.1.14 皮尔逊测度法就是利用算术平均数与众数的关系来测度数据分布 偏斜程度 的一种方法。
3.1.15 中心矩法 是指用标准差的三次方除三阶中心矩计算偏态系数的一种方法。
二、单项选择题(在每小题的3个备选答案中选出1个正确答案,并将其字母填在题干后面的括号内)
3.2.1 先将一组数据的变量值按一定顺序排列,然后取某一位置的变量值来反映这些数据的一般水平,把这个特殊位置上的数值看作是平均数,称为 ( B )
A.数值平均数 B.位置平均数 C.离散系数
3.2.2 算术平均数反映的是数据分布的什么特征 ( A ) A.集中趋势 B.离散趋势 C.偏态趋势 3.2.3 根据算术平均数的性质,下列表达式正确的是 ( A )
A.?(x?x)f?0 B.
?x-xf=0 C.?(x-x)2f=0
3.2.4 如果分布数列中各变量值呈几何级数变化或频率分布极不对称,计算平均数的常用方法是 ( B )
A.算术平均法 B.几何平均法 C.调和平均法
3.2.5 用各组的组中值代表其实际数据计算算术平均数时,通常假定 ( A ) A.各组数据在组内是均匀分布的 B.各组次数相等 C.各组数据之间没有差异
3.2.6 当数据分布为右偏分布时,算术平均数与中位数、众数的关系表现为 ( A ) A.Mo?Me?x B.x?Me?Mo C.x?Mo?Me
3.2.7 离散程度测度指标中,受极端值影响最大的是 ( C ) A.平均差 B.标准差 C.全距
3.2.8 平均差与标准差的主要区别在于 ( B ) A.说明问题的角度不同 B.对离差的数学处理方法不同 C.计算对象不同
3.2.9 标准差系数消除了 ( B ) A.总体单位数多少的影响 B.平均数大小和计量单位的影响 C.离散程度的影响
15