《数据分析与软件运用》
实验指导书
南京农业大学工学院 王明芳
2011-8-3
11-1
1.实验内容
《数据分析与软件运用》课程实验是我系管理科学与工程类学科下工业工程、物流工程、工程管理等专业学生的重要教学实践环节之一,通过课程实验可以进一步掌握数据的分析方法及相应软件的运用,从而增强分析实际问题的能力。
2.课程实验的主要工作任务及要求
我院设计的数据分析与软件运用实验以及开发的实验环境主要用于统计、工程管理、工业工程、物流工程等专业本科《数据分析》课程的辅助教学。另外,此套实验也适用于统计机构、市场调查公司进行基础培训。
(一)掌握数据的收集、整理及分析方法
(二)学会用图表展示数据;概括数据的基本特征;从数据中找出特征;学会对未知的总体进行推断;检验你所提出的假设;比较几个总体见有无差异;如何应用统计方法控制产品质量等内容
3.课程实验的进度安排
实验一:建立数据集、数据集的预处理、数据的描述统计分析
学时2 实验地点:管理系机房 实验二:均值、方差、相关与回归分析
学时2 实验地点:管理系机房 实验三:多变量分析
学时2 实验地点:管理系机房 实验四:综合实验
学时2 实验地点:管理系机房
4.课程实验报告
(一)课程实验总结报告
按统一格式、采用统一报告纸,报告内容应包括实验名称、目的、内容、原理和实验成果等。
(二)实验报告格式要求:排版打印具体如下:
1、封面 主标题名称:写明实验的名称 姓名: 班级: 实验时间: 2、正文
一级标题:宋体, 四号字, 加粗; 二级标题:宋体,小四号,加粗; 三级标题:宋体,小四号,加粗; 正文:宋体,小四号,单倍行距;
插入页码(居中)
3、文中页面设置采用默认值;
4、文中图表均需要统一编号并标出,符号、图形等所表达的意义,必须清晰完整
11-2
5.课程实验的考核成绩
(一)考核等级
根据实验报告进行评分,分为优、良、中、及格和不及格五个等级 (二)打分依据
1、是否达到实验的基本要求
2、报告的完整性,资料收集和整理的全面程度和准确性 3、报告的整洁与排版的规范性
实验一 建立数据集(1)
【实验目的】
1、掌握统计数据的基本结构
2、了解原始样本数据与SPSS数据集之间的对应关系 3、熟练掌握SPSS数据集的建立方法 4、熟悉SPSS主窗口及主要界面 【知识准备】
1、变量及其类型的划分 2、数据的结构 【实验内容】
时下大学生逃课成了一种比较普遍的现象,对各高校来说是一个不容忽视的问题,它会影响到学校教学质量和学生专业知识的提高,正常的教学秩序会促进校风的建设,同时也可为学生的学习创造一个良好的环境
经历了“黑色”的六月,千辛万苦,好不容易迈进梦寐以求的大学校园,背负着父母殷切希望的大学生本应珍惜学习机会,努力学习,可他们为什么要逃课呢,逃课后又在做什么‘逃课是否会影响学习成绩呢,带着这些疑问,请针对大学生“必修课选逃,选修课必逃”现象展开调查,把调查的资料录入到SPSS文档中 【实验步骤】 1、确定变量个数 2、定义变量属性
3、录入样本数据 【问题思考】
1、调查问卷中的问答设计一般有哪几种方式可采用?
2、根据本次调查的研究目的,本问卷是否有必要增加变量,多提一些问题
3、本试验中的样本数据不包含数值型变量,如出现数值型变量,应如何定义其SPSS数据集中的10个变量
【实验总结】
就您所感兴趣的课题,自主设计调查方案,搜集有关数据,并建立一个包含品质变量和数值型变量的SPSS数据集
实验一 数据集的预处理(2)
【实验目的】
1、 了解对原始数据进行预处理的意义
11-3
2、进一步熟悉SPSS主窗口中的数据浏览界面
4、熟悉掌握针对SPSS数据集进行编辑、整理和初步加工的方法和步骤 【知识准备】 1、数据的审核 2、数据分组 【实验内容】
前面根据大学生逃课设计的问卷过于简单,不能满足进一步深入和展开问题研究的需要。为此,还必须搜集100多位以上的同学的英语、数学、经济学、统计学等几门课程的期末考试成绩。所获取的数据是一个Excel文档,参见数据data2-1,现在需要把这个Excel格式的文件转换为spss数据集,再与实验一中的数据data1-1合并为一个完整的spss数据集 【实验步骤】
1、转换Excel格式文件为spss数据集 2、合并数据 3、排序 4、简单计算 5、选择观测 6、清点观测 7、分类汇总 8、分组
9、拆分数据 【问题思考】
1、为何要进一步搜集100多位同学的各门课的考试成绩?可通过何种方式、何种途径获得这些数据
2、清点观测中,如果仅仅是针对男生且各门课考试成绩85分以上者,应如何操作 3、若要对逃课后活动和对逃课的看法两个变量中的不同情况进行双重拆分,应当如何操作? 【实验总结】
结合实验内容和本实验中提供的数据,自主完成Edit,View,Data,Transform4个主菜单中所有操作。
实验一 数据的描述统计分析(3)
【实验目的】
1、 掌握定类数据、定序数据和数值型数据的图表表示方法 2、掌握定类数据、定序数据和数值型数据图表表示的Spss操作
3、熟练描述统计量的类型划分及其作用
4、准确理解各种描述统计量的构造原理并熟练掌握描述统计量的spss操作 5、培养运用描述统计方法解决身边之际问题的能力 【知识准备】
1、定类数据的频数分布表、分布图(条形图、帕累托图、饼形图) 2、数值型数据的频数分布表、分布图(茎叶图、盒行图、直方图) 3、描述集中趋势、离散趋势及分布形态的统计量 【实验内容】
随着证券市场的发展,基金理财目前已成为一种非常普遍的投资方式。统计数据显示,目前基金持有人账户总数已过1.1亿户,估计约有四分之一的城镇居民家庭参与了基金投资。投资者面对300多只基金,如何选择基金公司,投资何种类型的基金,需要对基金作出全面了解的基础上进行决策。这里搜集了晨星开放式基金2007年业绩业绩评级资料,供您分析使用。此数据以2007年12月28日最后一个交易日为截止日期,反映了317只开放式基金的综合数据。见数据data3-1.sav,这些变量中,V24是我们比较关心的一个丁磊变量,V5,V6为比较典型的两个定序变量。针对这些变量数据制作频数分布表和分布图
11-4
为帮助您了解和分析上海的综合状况,我们搜集到上海A股的一部分财务数据并建立了Spss数据集。见数据data4-1.sav,此数据级反映上海A股中32各行业840家上市公司2007年12月28日,即本年度最后一个交易日的资料,请根据需要制作品数分布图表进行通描述
绝大多数课程的期末考试成绩成对称的钟形分布,但这也不是绝对的规律。“证券市场模拟实战”是一门深受学生喜爱的选修课程,课程性质有其特殊性,那么其期末考试成绩是否也有其分布规律的特殊性?这里有一份2008年期末5个班263名学生的考试成绩,见数据data5-1.sav,请运用统计量描述手段对此数据做一个分析 【实验步骤】
1、V24频数分布表与频数分布条形图
打开数据集 Analyze---Descriptive Statistics—Frequencies 根据提示进行操作 V5的频数分布饼形图帕累托图 Graphs—Pie ;Pareto 根据提示进行操作
2、V3茎叶图 打开数据集 Analyze---Descriptive Statistics—Explore 根据提示进行操作 3、V8频数分布盒形图V10频数分布直方图 Graphs—Boxplot , Histogram
4、263名学生成绩整体的统计量描述 Analyze---Descriptive Statistics—Descriptives 5、各班级学生成绩的统计量描述 Data—Split File 系统将数据拆分成5组 Analyze---Descriptive Statistics—Descriptives 【问题思考】
1、定类数据和定序数据的频数分布表有何不同?
2、欲制作不同投资类型下的V5和V6的聘书分布图表,应如何操作
3、数据集中的大量数据可谓我们选择具体的基金管理公司提供什么帮助?
4、直方图与条形图有什么不同
5、欲比较不同行业在同已变量上的频数分布直方图,应如何操作 6、由此数据集中的数据我们可以认识到上海A股股市的哪些特点
7、Spss中还可以通过哪些途径计算有关的描述统计量
8、试对此数据集进行图表描述,并结合本试验中的输出结果评述此课程考试成绩的频数分布特征
【实验总结】
观察上述实验步骤中的输出结果,发现问题,思考原因,撰写一份数据分析报告
实验二 均值分析(1)
【实验目的】
2、 准确掌握单样本、两个独立样本和配对样本t检验的方法原理
2、熟练掌握单样本、两个独立样本和配对样本t检验Spss操作
3、学会利用单样本、两个独立样本和配对样本t检验的方法解决身边的实际问题 4、熟悉SPSS主窗口及主要界面 【知识准备】 1、t检验的基本概念 2、t检验的基本步骤
11-5