SPSS北大社会学系讲义分解(2)

2018-11-17 21:25

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

四.SPSS文件类型

1.原始数据文件及其类型 *. Dat(原来还有ASCII码) 生成方法

DOS中的EDIT WORD中的·TXT EXCEL中的·XLS DBASE中的·DBF

以上形式的数据文件在SPSS中可以直接调用 打开一个已有的数据文件的方式如下:

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

2.数据文件

*·SAV *·SAS(原来)

数据文件可以根据原始数据的转换获得 3.图形文件 *·CHT 4.命令文件 *·SPS

5.结果文件 *·SPO(OUTPUT, 原来是·LST)

五.问卷及编码

1. 多选择题的处理(0,1编码) 2. 多位题(要补位)

3. 缺失值,以9结尾,如年龄,编码为99,如答案正好是9,以0替补

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

4. 不适用,以8结尾,8,98,998,如答案正好是8,以0替补。如有四个可选项的多选题而不适用,则为8888。 六.什么是数据

数据是一个矩阵,行是一个case在多维空间下的位置,列是不同空间的维度用来分析用行收集到的资料。

数据分析:用微观的方法分析宏观的资料,分析平均人、平均的体系;这个分析都是在平均的基础上,这种推断是不能还原到个案的,分析的过程是不断抛弃个人影响的过程。

数据的计算机表示法:变量------问卷中的每一个问题, 在dBASE中称为字段(Field) 变量名---变量名以字母为首,后面跟A---Z, 0-----9字符(字符≤8个字符), 变量名不能带扩展名,如 A1·1。 变量值----变量的答案 七.数据录入——问卷资料转变为原始数据文件 (一) WORD中录入,存成·TXT 1.方法:打开WORD文档,录入数据

固定格式:这种数据要根据已经确定的栏目位置对号入座地录入数据,在对问卷进行编码时,指定了各个项目的数值与栏位(书P10),给数据指定栏目位置时,前后数据一般不留空格,这样可以提高数据录入的速度,缺点是前后的数据不太容易区分。如: 栏位(列号)

1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 0 0 0 0 1 2 2 6 1 5 0 0 0 0 0 0 2 2 3 1 4 0 0

自由格式P22:按照问卷编码方案将某个个案数据直接录入,中间可以没有任何空格和其他符号,也可以在输入时在不同的变量之间以空挡、逗号、分号等把变量分开,不同个案之间的数据要对齐,数据录入完成以后,存成*·TXT文件 2.把 ·TXT文件转变为*·SAV文件

SPSS——File--------Read Text Data-----------点选*·TXT-------对话框(六步),即Text Import Wizard-------Fixed wide------No------下一步--------The first case begins on which line----------划线即可-------下一步完成

SPSS——File--------Read Text Data-----------点选*·TXT-------对话框(六步),即Text Import Wizard-------Delimite-------下一步--------SPACE-------下一步--------完成

如果特殊数据、负数、小数点多时,则不用这种方法,可以用EXCEL录入。

(二) 在 EXCEL中录入数据 打开EXCEL表

不用补0,可以录入汉字,速度较慢,一般在小样本时用比较好。 第一行录入变量,第二行开始录入数据

文件保存类型:*·XLS(·工作簿BOOK) 转变为为*·SAV文件:

SPSS--------File--------Open---------Data----------点选文件类型*·XLS-------点选BOOK-------OK------存成SPSS的*·SAV文件即可

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

用EXCEL录入的优点:

[1]可以进行各种计算,如数学与三角函数 [2]可以进行位置计算,还可以直接COPY [3]可以用EXCEL做辅助分析,进行数据变换 [4]可以作表,非常方便

(三)在SPSS中录入

直接在SPSS WIN中录入数据

方法:SPSS——FILE——NEW DATA——点选Data View(数据浏览界面)——录入数据——存成*·SAV,适合于较小的样本

在Data View(数据浏览界面)中录入的数据还没有在各个数据之间区分意义,可以在Variable View(变量浏览界面)中对录入数据的意义进行界定,这个工作也可以在问卷数据录入前做,也可以在数据录入后做。

点击Variable View(变量浏览界面),对变量进行定义。定义变量有10种功能选项,

[1]Name: 变量栏名,在这个栏目中输入变量名,如 V1、V2、 age sex 或其他名称。

定义变量名注意:

A.变量名以字母为首,后面跟A---Z, 0-----9字符(字符≤8个字符), ? ! / ‘’等不能作为变量名, 变量名也不能带扩展名,如 A1·1。

B.有些关键词不能作为变量的名字,如 AND OR NOT EQ LT LE GT GE NE NE TO BY——crosstabs WITH ALL THRU P---Percentage SPSS中不区别大小写字符

可以用中文做变量名,但最好不用,因为涉及一个兼容性问题。

北京大学社会学系 数据分析课程讲义 刘爱玉 2004年

[2]Type:变量类型, 有8种类型可供选择

Numeric:数值型变量,系统默认值为数值型,系统默认长度为8,小数位数为2

Comma:带逗号的数值型变量,即整数部分每3位数加一逗号,其余定义方式同数值

型。输入:1,287,300,显示:1,287,300

Dot:带圆点的数值型变量,3位加点数值型,无论数值大小,均以整数形式显示,每3

位加一小点(但不是小数点),可定义小数位置,但都显示0,且小数点用逗号表示。如1.2345显示为 12.345,00(实际是12345E-4).

Scientific notion:科学记数法 输入:253.7E2,输出:253.7E2 Date:日期型变量,有27种表示方法。点date即可以看到 Dollar:货币型变量,有12种表示方法

Custom currency: 自定义型变量,是一种用户利用Edit 菜单的Options功能定义的。

String:字符型变量

一般最常用的是数字型变量与字符型变量。

日期型变量格式:

dd—mmm—yyyy 日日-月月月-年年年年

mm/dd/yyyy 月月/日日/年年年年 qQyyyy 季度Q年年年年 mMmyy 月份年年 wWWKyy 周数WK年年 hh:mm:ss 时时分分秒秒

SPSS中存储的实际上是该时间与1582年10月14日零点相差的秒数,如1582年10月15日存储的就是60×60×24=86400,在我们把变量类型变换为数值型时可以看到这种数字。如定date的类型为mm/dd/yyyy,输入10/15/1582, 当我


SPSS北大社会学系讲义分解(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:2014年最新版PEP英语五年级上册-各单元测试题(unit-1-unit-6)

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: