北京大学社会学系 数据分析课程讲义 刘爱玉 2004年
们把日期型数据转变为数值型数据时,看到数据变为86400。
货币型变量格式
格式 总长度 小数位数 $# 2 0 $# # 3 0 $# # # 4 0 $# # # ·## 7 2 $# ,# # # 6 0 $# , # # # · # # 9 0 $# # #,# # #,# # #,# # # 16 0 $# # #,# # #,# # #,# # # ·# 19 2 # 要求:能够辨别数值型、字符型与日期型变量就可以。 [3]width:宽度,指的是运算宽度,默认值为8,运算宽度实际上只会改变输出结果的显示宽度,数据的存储结果与运算的精度不受宽度的影响。
[4]Decimals:小数位数,根据每个变量数据的大小,定义小数的位数 [5]Label :变量标签, 给相应的变量以文字说明 [6]values:数值标签,
value 1 value 男 add 最后点OK
[7]missing values缺失值,有三种选项
北京大学社会学系 数据分析课程讲义 刘爱玉 2004年
No missing values 没有缺失值
Discrete missing values 定义1—3个单一数为缺失值
Range plus optional discrete values 定义指定范围为缺失值,同时指定另外一个不在这一范围内的单一数为缺失值
缺失值的意义是指某一项值数值缺失,软件在进行统计时不将其考虑进去。
用户自己把特定的数据界定为缺失值,则为用户缺失值user-missing. 如可以把把被调查者拒绝回答或者问题不合适而没有回答的情况界定为用户缺失值9
系统缺失值 system missing主要是指计算机默认的缺失方式,如果在录入数据时空缺了某些数据,计算机就把其界定为缺失值,这是的数据标记为‘· ’,而用户界定的缺失值则不会在数据显示时出现‘· ’。
[8]columns:定义数据管理器纵列的长度 [9]字符排列方向:有三种选择 left左对齐 right 右对齐 center 居中
[10] measure:数据量度选择,有三种: scale 连续型变量,是测量的最高层次。 ordinal 定序型变量 Nominal 定类型变量
将变量定义完毕,点击数据编辑窗口,定义的变量会自动地出现在窗口中。 如何定义,进行操作演示
数据录入和变量定义完毕,可以将其存成*·sav文件,然后就可以用这些数据进行统计分析
北京大学社会学系 数据分析课程讲义 刘爱玉 2004年
(四)Epidat录入
http:/1121.91.14.201/php/index.php http:/www.epidata.dk 下载软件Epidat
建立数据描述文件——建立数据文件——数据录入——数据输出 *·qes *·rec dbase; excel;txt;data 屏幕设计 逻辑校验*·chk 1. 打开Epidat
[1]Define data——点选new qes file——建立一个空的untitled1文件,qes是qustionaire的缩写
北京大学社会学系 数据分析课程讲义 刘爱玉 2004年
[2]把空文件untitled1文件存成一个你想要的文件名(如存成first.qes)
方法:file菜单—— save as ——出来一个对话框——把untitled1改成 first.qes
[3]在空白的EpiEditor中录入——相当于变量名、变量标签、变量值的界定 录入原则: A. 必须有一个变量的名字,如V1, Sex, occupation等 B. 对变量进行描述,如V1 “个案号” “出生年月”等 C. 对变量录入的定义说明:Shift +#——#号键
北京大学社会学系 数据分析课程讲义 刘爱玉 2004年