北京大学社会学系 数据分析课程讲义 刘爱玉 2004年
SPSS数据分析技术课程提纲
教材:自编讲义
阮桂海主编, 2000,《SPSS实用教程》电子工业出版社 课程内容
第一讲 SPSS基本知识及数据录入 一.概述
二.SPSS的基本模块 三.SPSS的基本窗口 四.SPSS文件类型 五.问卷及编码 六.什么是数据
七.数据录入——问卷资料转变为原始数据文件 (一)WORD中录入
(二)在 EXCEL中录入数据 (三)在SPSS中录入 (四)Epidat录入
(六)数据文件的编辑与管理
第二讲 SPSS命令文件的编写 一 ·SPSS的命令文件 (一)Data list
(二)Variable label的命令格式 (三)value label的命令格式
(四)程序中的缺少值(Missing Value命令)
第三讲 用Frequencies做数据汇总 一. 数据汇总使用的数据类型 二·频次统计及统计量的计算 (一)Statistics——统计量 (二)画图
第四讲 描述性统计(Descriptives与Explore的应用) 一.Descriptives (一)应用实例 (二)统计量分析 二.Explore分析
第五讲 数据变换
一.Recode 命令对数据重新编码 二.用Compute命令创建新变量 三.COUNT命令
四.用If命令做条件变换和逻辑校
第六讲 交叉汇总与关联分析(Crosstabs的应用) 一. 交叉汇总表的一般形式及其特点 二. 交互表的检验——两个变量之间是否相关 三. 两个变量之间相关的强度 (一)定类——定类
北京大学社会学系 数据分析课程讲义 刘爱玉 2004年
(二)定序——定序 (三)定类——定距 (四)定距——定距
四.运用CRPSSTABS做交互表及对变量之间的关系进行测量
第七讲 引进其他变量后的交互分析 一. 因果分析——explanation model 二. 阐明分析——Interpretation analysis 三. 条件分析—— conditional analysis
第八讲 描述子总体均值的差异(Means过程的应用) 一.Means过程运行 二.One Sample T-Test
第九讲 均值比较分析(T——Test过程) 一.独立样本T检验 二.成对样本T-TEST 三.注意事项
第十讲 方差分析ANOVA 一. 实例 二. 解释
第十一讲 相关分析(Correlate过程分析) 一.Bivariate Correlate
二.Partial correlation偏相关(也叫净相关) 三.距离分析(Distance)
第十二讲 简单线性相关(一元线性回归分析) 一.回归分析对变量的要求(假设条件) 二.一元线性回归模型及其含义 三.在对话框中做一元线性回归模型
第十三讲 SPSS统计图形 一.Bar条形图
二.Line线图——年龄与收入 三.Area面积图 四. Pie饼图 五. High-LOW 高低图 六.Pareto 帕雷托图 七.Control 控制图 八.Boxplot 箱图
九.Error Bar 误差条图 十.Scatter 散点图 十一.Histogram 直方图 十二·P-P:P-P 概率图 十三·Q-Q:Q-Q 概率图 十四·Sequence 序列图
十五·Time Series 时间序列图
第十四讲 非参数检验
北京大学社会学系 数据分析课程讲义 刘爱玉 2004年
SPSS数据分析技术
第一讲 SPSS基本知识及数据录入 一.概述
SPSS(statistical package for the social science)是美国SPSS公司开发的社会科学统计软件,SPSS最初的几个版本都是在DOS系统下运行,虽然功能比较强,但在用户界面、输入、输出环境等方面并不十分理想。80年代末,Microsoft推出Windows后,SPSS迅速向Windows移植。90年代以来,由于MS Windows的普及,SPSS公司于1992、1993、1994年相继推出了在Windows操作系统下的5.0, 6.0 6.1版本,随着Windows95与WindowsNT3.5以上版本的32位操作系统的出现,1997年以来又相继推出了8.0,9.0,10.0及11.5版本。11.5版本的界面与10.0版本相比没有什么变化,只是增加了一些统计功能和方法。与其他版本相比,11.5版本的用户界面更为友好,使用更加方便,统计功能更为强大。它的基本特点有四个:
[1]大多数操作是通过菜单、图表按钮、对话框完成,操作简单方便;
[2]命令语句、子命令、选择项大部分通过对话框来进行,无需记忆大量的命令、过程与选择项;
[3]可以与其他数据转换接口,其他软件生成的数据,可以转化为SPSS数据 [4]与其他Windows兼容,输出结果可以复制到WORD,以便进一步编辑。
二.SPSS的启动及基本模块
BSPSS 11.0版一共由十个模块组成 SPSS BaseAdvanced Models Regression Models Tables Trends Categories Conjoint Exact Tests
Missing Value Analysis Maps
三. SPSS的基本窗口 (一)打开SPSS
北京大学社会学系 数据分析课程讲义 刘爱玉 2004年
(二)基本窗口-Data Editor
File 文件管理菜单,完成对数据文件的建立、读取、存储、打印等操作。 Edit 文件编辑菜单,完成对数据文件的重新编辑、检索、拷贝、剪贴与替
换等操作。
View 浏览编辑,完成文本或数据内容的状态栏、工具栏、字体、网格线以
及数值标签等功能的操作。
Data 数据管理,数据的选择、排序菜单,包括对数据行的增加、合并、
变量值的选择等
Transform 数据变换菜单,创建新变量、重新编码、计算同值的次数等。 Analyze 统计过程菜单,完成各种统计分析。 Graphs 统计图表,完成统计图表的建立与编辑
北京大学社会学系 数据分析课程讲义 刘爱玉 2004年
Utilities 实用程序,有关命令解释、字体选择、文件信息、定义输出标题和窗
口设计等。
Windows 窗口控制,可进行窗口的排列、选择和显示操作 Help 帮助文件, 帮助文件的调用、选择和显示等操作。
(三)SPSS的其他窗口
在SPSS的主窗口中还有两个窗口,一个是数据管理窗口,其标题名称是“Newdata”,且默认为激活状态。数据管理器是一种典型的电子表格形式,用户可通过定义变量名、格式化数据类型后输入原始数值,并可根据需要对数据进行增删、剪贴、修改、存储等操作。 另一个是结果输出窗口,标题名称是“!Output1”,启动时为非活动窗口,只有当完成一项处理后,才在该窗口显示处理过程提示和计算结果。
当进行某项具体的统计方法操作时,可点击对话框的“Paste”钮激活命令编辑窗口,其标题名称是“!Syntax1”,或选Window菜单的!Syntax1项也可激活命令编辑窗口。用户可利用该窗口进行SPSS命令的输入、编辑和运行,这对熟悉DOS版本的SPSS用户是十分方便的。
上述三个窗口在实际操作时,经常因为内容很多,一个窗口中无法看到全部内容。有两种方法可帮助用户看到全部内容:
1、使用窗口的滚动条 每个窗口的右侧有一个垂直滚动条,用鼠标点击滚动条上下两头的箭号钮或用鼠标按住滚动条中的方块上下拖动,可使窗口中的内容前后翻滚;底边有一个水平滚动条,用鼠标点击滚动条左右两头的箭号钮或用鼠标按住滚动条中的方块左右拖动,可使窗口中的内容左右移动。如此,用户便可看清所有内容。
2、改变窗口的大小 一般情况下,鼠标指针是一个朝左上方的箭头,当把鼠标指针指向窗口边界时,鼠标指针变成双向箭头形。这时,若按住鼠标左键移动,可改变窗口的大小,同样可看清窗口内容。
SPSS的退出
完成SPSS的统计分析后,退出该系统的方法是:选File菜单的Exit项,回答系统提出的有关是否需要存储原始数据、计算结果和SPSS命令之后,即退到Windows的程序管理器中。
SPSS的求助系统
SPSS提供了丰富且详尽的在线帮助。主要有下列几种方式:
1、主窗口的Help菜单:在软件运行的任何时候,点击Help菜单选相关的子菜单,可得到所需的各种帮助。
2、主窗口的Utilities菜单:在Utilities菜单中,有Command index...子菜单,它提供有关SPSS各项统计分析技术能解决什么问题的信息。 3、各种对话框中的Help钮:在具体操作过程中,当弹出某一对话框时,一般总有Help钮,点击该钮,用户可得到这一对话框选项内容的详细帮助。
4、结果输出窗口中的Grossary钮:当用户在浏览计算结果时,可点击结果输出窗的Grossary钮,它显示各种专用统计术语的解释信息以便用户理解。
5、命令编辑窗口中的Syntax钮:激活命令编辑窗,可见一Syntax钮,点击该钮,可得到与用户正在编辑的命令相关的命令语法提示。