统计学课后习题答案(袁卫、庞皓、曾五一、贾俊平)第三版 第1章 绪论
1.什么是统计学?怎样理解统计学与统计数据的关系?
2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体;
(2)描述研究变量; (3)描述样本; (4)描述推断。
答:(1)总体:最近的一个集装箱内的全部油漆;
(2)研究变量:装满的油漆罐的质量;
(3)样本:最近的一个集装箱内的50罐油漆;
(4)推断:50罐油漆的质量应为4.536×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体;
(2)描述研究变量; (3)描述样本; (4)一描述推断。
答:(1)总体:市场上的“可口可乐”与“百事可乐”
(2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。
第2章 统计数据的描述——练习题
1. 解:(1)由于表2.21中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。
(2)频数分布表如下:
服务质量等级评价的频数分布
服务质量等级
A B C D E 合计
家庭数(频数)
14 21 32 18 15 100
频率% 14 21 32 18 15 100
(3)条形图的制作:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→条形图→选择子图表类型→完成(见Excel练习题2.1)。即得到如下的条形图: 2. 解:(1)要求对销售收入的数据进行分组,
全部数据中,最大的为152,最小的为87,知数据全距为152-87=65;
1
为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分;
为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式;
按照“上限不在组内”的原则,用划记法统计各组内数据的个数——企业数,也可以用Excel进行排序
统计(见Excel练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列;
将各组企业数除以企业总数40,得到各组频率,填入表中第三列;
在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐
组计算企业数的向下累积及频率的向下累积。
整理得到频数分布表如下:
40个企业按产品销售收入分组表 按销售收入分组 企业数 频率 向上累积 (万元) (个) (%) 企业数 频率 100以下 100~110 110~120 120~130 130~140 140以上 合计 5 9 12 7 4 3 40 12.5 22.5 30.0 17.5 10.0 7.5 100.0 5 14 26 33 37 40 — 12.5 35.0 65.0 82.5 92.5 100.0 — 向下累积 企业数 40 35 26 14 7 3 — 频率 100.0 87.5 65.0 35.0 17.5 7.5 — (2)按题目要求分组并进行统计,得到分组表如下:
某管理局下属40个企分组表
按销售收入分组(万元) 企业数(个)
先进企业 良好企业 一般企业 落后企业 合计
11 11 9 9 40
频率(%) 27.5 27.5 22.5 22.5 100.0
3.解:全部数据中,最大的为49,最小的为25,知数据全距为49-25=24;
为便于计算和分析,确定将数据分为5组,各组组距为5,组限以整5的倍数划分;
为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值24已落在最小组之中,最大值49已落在最大组之中,故将各组均设计成闭口形式;
按照“上限不在组内”的原则,用划记法或用Excel统计各组内数据的个数——天数,(见Excel练习题
2.3)并填入表内,得到频数分布表如下表中的左两列;
将各组天数除以总天数40,得到各组频率,填入表中第三列; 得到频数分布表如下:
某百货公司日商品销售额分组表
按销售额分组(万元)
25~30 30~35 35~40 40~45 45~50 合计
频数(天)
4 6 15 9 6 40
频率(%) 10.0 15.0 37.5 22.5 15.0 100.0
直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→柱形图→选择子图表类型→完成。即得到如下的直方图:(见Excel练习题2.3)
2
4解:(1)排序:将全部数据复制到Excel中,并移动到同一列,点击:数据→排序→确定,即完成数据排序的工作。(见Excel练习题2.4)
(2)按题目要求,利用已排序的Excel表数据进行分组及统计,得到频数分布表如下: (见Excel练习题2.4)
100只灯泡使用寿命非频数分布
按使用寿命分组(小时) 灯泡个数(只) 频率(%)
650~660 660~670 670~680 680~690 690~700 700~710 710~720 720~730 730~740 740~750 合计
2 5 6 14 26 18 13 10 3 3 100
2 5 6 14 26 18 13 10 3 3 100
制作直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,选择全表后,点击:图表向导→柱形图→选择子图表类型→完成。即得到如下的直方图:
(见Excel练习题2.4)
(3)制作茎叶图:以十位以上数作为茎,填入表格的首列,将百、十位数相同的数据的个位数按由小到大的顺序填入相应行中,即成为叶,
得到茎叶图如下:
65 1 8 66 1 4 5 6 8 67 1 3 4 6 7 9 68 1 1 2 3 3 3 4 5 5 5 8 8 9 9 69 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 70 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 9 71 0 0 2 2 3 3 5 6 7 7 8 8 9 72 0 1 2 2 5 6 7 8 9 9 73 3 5 6 74 1 4 7
5.解:(1)由于各天气温的记录数据属于数值型数据,它们可以比较高低,且0不表示没有,因此是定距数据。
(2)分组如下:
由于全部数据中,最大的为9,最小的为-25,知数据全距为9-(-25)=34;
为便于计算和分析,确定将数据分为7组,各组组距为5,组限以整5的倍数划分;
为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值-25已落在最小组之中,最大值9已落在最大组之中,故将各组均设计成闭口形式;
按照“上限不在组内”的原则,用划记法(或Excel排序法,见Excel练习题2.5)统计各组内数据的个数——天数,并填入表内,得到频数分布表如下表;
北方某城市1~2月份各天气温
分组
天数(天)
3
-25~-20 -20~-15 -15~-10 -10~-5 -5~0 0~5 5~10 合计
8 8 10 14 14 4 7 65
(3)制作直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→柱形图→选择子图表类型→完成。即得到如下的直方图:(见Excel练习题2.5)
6.解:(1)制作直方图:将上表复制到Excel表中,点击:图表向导→柱形图→选择子图表类型→完成。即得到如下的直方图:(见Excel练习题2.6)
(2)年龄分布的特点:自学考试人员年龄的分布为右偏。 7 解:(1)将树茎放置中间,A班树叶向左生长,B班树叶向右生长,得茎叶图如下: A班 数据个数 树 叶 树茎 B班 树叶 数据个数 0 1 2 11 23 7 6 0 4 97 97665332110 98877766555554443332100 6655200 632220 3 4 5 6 7 8 9 10 59 0448 122456677789 011234688 00113449 123345 011456 000 2 4 12 9 8 6 6 3 (2)比较可知:A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,且平均成绩较A班低。 8
解:箱线图如下:(特征请读者自己分析)
9. 解:(1)将全部30个数据输入Excel表中同列,点击列标,得到30个数据的总和为8223, 于是得该百货公司日销售额的均值:(见Excel练习题2.9)
x=
?x=8223=274.1(万元)
n30或点选单元格后,点击“自动求和”→“平均值”,在函数EVERAGE()的空格中输入“A1:A30”,回车,
得到均值也为274.1。
在Excel表中将30个数据重新排序,则中位数位于30个数据的中间位置,即靠中的第15、第16两个数
272和273的平均数:
Me=
272?273=272.5(万元) 2由于中位数位于第15个数靠上半位的位置上,所以前四分位数位于第1~第15个数据的中间位置(第8
位)靠上四分之一的位置上,
由重新排序后的Excel表中第8位是261,第15位是272,从而:
4
QL=261+
273?272=261.25(万元) 4 同理,后四分位数位于第16~第30个数据的中间位置(第23位)靠下四分之一的位置上,由重新
排序后的Excel表中第23位是291,第16位是273,从而:
QU=291-
273?272=290.75(万元)。 4(2)未分组数据的标准差计算公式为:
?(x?x)i302 s=i?1n?1 利用上公式代入数据计算是个较为复杂的工作。手工计算时,须计算30个数据的离差平方,并将其求和,()再代入公式计算其结果:得s=21.1742。(见Excel练习题2.9)
我们可以利用Excel表直接计算标准差:
点选数据列(A列)的最末空格,再点击菜单栏中“∑”符号右边的小三角“▼”,选择“其它函数”→选择函数“STDEV” →“确定”,在出现的函数参数窗口中的Number1右边的空栏中输入:A1:A30,→“确定”,即在A列最末空格中出现数值:21.17412,即为这30个数据的标准差。于是:
s?21.17(万元)。(见Excel练习题2.9)
10.比较哪个企业的总平均成本高?并分析其原因。 解:设产品单位成本为 x,产量为f,则总成本为xf,
xf?由于:平均成本x=
?f又因个别产品产量f =
=
总成本,而已知数据中缺产量f 的数据,
总产量该产品成本xf=
该产品单位成本xxf?从而 x=
xf?x,于是得:
甲企业平均成本=
?xfxf?x?xfxf?x=
2100?3000?1500=19.41(元),
210030001500??1520303255?1500?1500=18.29(元),
325515001500??152030乙企业平均成本==
对比可见,甲企业的总平均成本较高。
原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
11
解:设各组平均利润为 x,企业数为f,则组总利润为xf,
由于数据按组距式分组,须计算组中值作为各组平均利润,列表计算得:
按利润额分组(万元)
组中值 x
企业数(个)
f
总利润 xf
5