实训项目三、运用Excel进行数据整理
一、实训学时
2学时
二、实验目的
1.掌握Excel中基本的数据处理方法。
2.掌握用Excel作数据的频率分布表和直方图。 3.掌握用Excel作常用统计图。 三、实验要求
1、已学习教材相关内容,理解数据整理中的统计计算问题。 2、准备好相应数据。 四、实验内容和操作步骤
(一)用Excel作数据的频率分布表和直方图
利用Excel处理数据,可以建立频率分布表和条形图。一般统计数据有两大类,即定性数据和定量数据。定性数据用代码转化为定量数据后再处理,这里就不涉及了,下面主要以定量数据为例来说明如何利用Excel进行分组,并作频率分布表和直方图。
[资料]现有某管理局下属40个企业产值计划完成百分比资料如下: 97、123、119、112、113、117、105、107、120、107、125、142、103、115、 119、88、115、158、146、126、108、110、137、136、108、127、118、87、 114、105、117、124、129、138、100、103、92、95、127、104 (1)据此编制分布数列(提示:产值计划完成百分比是连续变量); (2)计算向上累计频数(率); (3)画出次数分布直方图。 [步骤]
第1步:打开Excel界面,输入40个企业的数据,从上到下输入A列(也可分组排列)。 第2步:选择“工具”下拉菜单,如附图3.1:
10
图表 3.1
第3步:选择“数据分析”选项,如果没有该功能则要先行安装。“数据分析”的具体安装方法,选择“工具”下拉菜单中“加载宏”,在出现的选项中选择“分析工具库”,并“确定”就可自动安装。
图表 3.2
第4步:在分析工具中选择“直方图”,如附图3.3:
11
图表 3.3
第5步:当出现“直方图”对话框时,在“输入区域”方框内键入A2:A41或$A$2:$A$41(“$”符号起到固定单元格坐标的作用,表示的是绝对地址),40个数据已输入该区域内,如果是分组排列的,就应选择整个分组区域。在“接收区域”方框内键入C2:C9或$C$2:$C$9,所有数据分成8组(主要根据资料的特点,决定组数、组距和组限),把各组的上限输入该区域内。在“输出区域”方框内键入E2或$E$2,也可重新建表在其他位置。对话框中,还选择“累积百分率”、“图表输出”(如附图3.3)。
最后:点“确定”,就可得到结果。 对话框内主要选项的含义如下:
输入区域:在此输入待分析数据区域的单元格范围。
接收区域(可选):在此输入接收区域的单元格范围,该区域应包含一组可选的用来计算频数的边界值。这些值应当按升序排列。只要存在的话,Excel 将统计在各个相邻边界值之间的数据出现的次数。如果省略此处的接收区域,Excel 将在数据组的最小值和最大值之间创建一组平滑分布的接收区间。
标志:如果输入区域的第一行或第一列中包含标志项,则选中此复选框;如果输入区域没有标志项,则清除此该复选框,Excel 将在输出表中生成适宜的数据标志。
输出区域:在此输入计算结果显示的单元格地址。如果不输入具体位置将覆盖已有的数据,Excel 会自动确定输出区域的大小并显示信息。
柏拉图:选中此复选框,可以在输出表中同时显示按升序、降序排列频率数据。如果此复选框被清除,Excel 将只按升序来排列数据。
12
累积百分比:选中此复选框,可以在输出结果中添加一列累积百分比数值,并同时在直方图表中添加累积百分比折线。如果清除此选项,则会省略以上结果。
图表输出:选中此复选框,可以在输出表中同时生成一个嵌入式直方图表。[结果] 有关结果如附图3.4。完整的结果通常包括三列和一个频数分布图,第一列是数值的区间范围,第二列是数值分布的频数(不是频率),第三列是频数分布的累积百分比。
图表 3.4
直方图是用矩形的宽度和高度来表示频数分布的图形。绘制直方图时,将所研究的变量放在横轴上,频数、频率放在纵轴上。每组的频数、频率在图上就是一个长方形,长方形的底在横轴上,宽度是组距,长方形的高就是对应的频数或频率。应当注意,上图实际上是一个条形图,而不是直方图,若要把它变成直方图,可按如下操作:
用鼠标左键单击图中任一直条形,然后右键单击,在弹出的快捷菜单中选取“数据系列”格式,弹出数据系列格式对话框。在对话框中选择“选项”标签,把“分类间距”宽度改为0,按确定后即可得到直方图,如附图3.5所示。
13
图表 3.5
(二)用Excel作常用统计图
Excel有较强的作图功能,可根据需要选择各类型的图形。Excel提供的统计图有多种,包括柱形图、条形图、折线图、饼图、散点图、面积图、环形图、雷达图、曲面图、气泡图、股价图、圆柱图、圆锥图等,各种图的作法大同小异。
1、饼图的绘制
饼图也称圆形图,是用圆形及圆内扇形的面积来表示数值大小的图形。饼图主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用。
[资料]据中国互联网络信息中心2006年6月底的统计,我国目前网民的年龄分布如下表(表格3.1),根据资料利用Excel绘制饼图。
表格 3.1我国目前网民的年龄分布结构表
年龄 18岁以下 18~24岁 25~30岁 31~35岁 36~40岁 41~50岁 51~60岁 60岁以上 [步骤]
比重% 14.90% 38.90% 18.40% 10.10% 7.50% 7.00% 2.40% 0.80% 先把数据输入到工作表中,如附图2-1所示,可按下面的步骤操作。
14