18 19 20 男 女 男 16 16 18 12.40 8.05 14.03 38 39 40 男 女 男 17 16 16 10.98 8.78 11.35 Step1:建立数据文件。定义4个变量:ID、Gender、Age和HB,分别表示编号、性别、年龄和血红蛋白值。
Step2: 选择菜单“Analyze→Compare Means→Means”,弹出“Means”对话框。在对话框左侧的变量列表中,选择变量“血红蛋白值”进入“Dependent List”列表框,选择变量“性别”进入“Independent List”,单击“Next”按钮,选择变量“年龄”进入“Independent List”。
Step3:单击“Options”按钮,在弹出的“选择描述统计量”对话框中设置输出的描述统计量。
Step4:单击“OK”按钮,得到输出结果。
要求:求出18岁男士的血红蛋白均值;所有女士的血红蛋白均值;所有16岁人士的血红蛋白均值。 (iii)回归分析:
某水稻品种在5月5日至8月5日(每隔10天播一期),测定播种至齐穗的天数x和播种至齐穗的总积温y(单位:d·℃)的数据见下表,试使用线性回归确定y与x的关系式。
x y 70 67 55 52 51 52 51 60 64 1616.3 1610.9 1440.0 1440.7 1423.3 1471.3 1421.8 1547.1 1533.0 Step1:建立数据文件,定义变量,输入数据。
Step2:菜单“Analyze→Regression→Linear”,弹出“Linear”对话框。 Step3:选y为因变量,x为自变量。
Step4:单击“Statistics”按钮,选择“Estimates”、“Confidence Interval”、“Covariance Matrix”、“Model Fit”、“R Squared Change”、“Durbin Watson”,其他默认。可得回归模型分析表。
要求:写出x与y的回归方程;两个变量之间的相关系数。 课外拓展:想办法利用SPSS作出(iii)中的数据线性回归图。
6
实验二 简单随机抽样
一、实验背景。
简单随机抽样(simple random sampling, SRS)是最简单的概率的抽样方法, 也是其他抽样方法的基础。这样抽取的样本称为简单随机样本,在此方法下总体中的每一个体被抽到的概率完全相同。简单随机抽样是最为常用的方法,也最能体现抽样统计的思想。 二、设备要求。
PC一台,安装软件有Excel 2003以上版本和SPSS 10.0以上版本。 三、实验目的。
(1) 学会建立简单的电子抽样框;
(2) 在Excel中,通过随机函数或随机数发生器产生随机数实现简单随机
抽样;
(3) 利用SPSS软件实现简单随机抽样,并进行初步的数据分析。 四、实验要求。
实验1 在EXCEL中,采用RAND函数随机抽样本班中的8个同学的学号,并调查抽到的同学的身高数据,同时录入保存。
实验2 某电视台举行幸运观众抽奖,需要从编号为000001到999999的热 心观众中随机抽取20位幸运观众赠送礼品,采用RANDBETWEEN函数随机选出幸运观众的号码,并对号码排序。
实验3 某中学为了调查全校2818名同学身体素质的基本状况,现利用SPSS 软件简单随机抽取300个样本进行调查(参照课本68页)。 五、友情提示。
1. RAND函数的一个例子:
(1)RAND返回一个0~1的均匀分布随机数,若要生成a与b之间的随机 实数。可使用公式RAND*(b-a)+a;(图1.1)
7
图1.1
(2)鼠标拖拽自动填充单元格,完成20个样本抽样(图1.2左)。抽样取得后(有重或缺勤),只要按F9(或重新打开文件),就会得到一组新的抽样。点击工具栏
取得整数抽样(图1.2右)。
图1.2 (3)保存随机数。选中随机抽样数据,右击->复制,再次右击->选择性粘贴,弹出对话框中粘贴选项选择数值,运算选项选择无,确定即可。至此公式转化为常数,不再变化。
图1.3
8
2.RANDBETWEEN(a, b)函数返回a~b之间的随机数。如果函数不能用,并返回错误值#NAME?,请通过工具->加载宏,安装并加载“分析工具库”加载宏(图1.4)。
图1.4
(1) 设置数字类型。
右击菜单->设置单元格格式->数字->自定义->类型“000000”
(2) 输入随机函数“=RANDBETWEEN(0,999999)”,自动填充20个单元格。 (3) 固定抽取结果。选择数据区域,右击->复制->单击工具栏粘贴按钮下拉菜单->值。
(4) 结果排序。数据->排序->主要关键字“观众编号”->升序->确定。
要求:比较两个函数的优劣。 课外拓展:使用Excel产生随机数据,还有其他那些方法? 9
实验三 数据的整理与预处理
一、实验目的。
(1)熟悉SPSS数据编辑框,会定义和设置变量,会输入数据; (2)会对数据进行排序、筛选、转置等预处理; (3)会通过计算定义新变量。 二、实验要求及步骤。
实验1 用SPSS输入数据
表2-3 需要录入的数据
编号 1 2 3 4 5 6 7 8 班级 1 1 2 2 3 3 4 4 性别 0 1 0 1 0 1 0 1 考试成绩 85 90 87 69 78 93 83 91
Step1:在变量表第一列中依次输入―编号‖―班级‖等四个变量名, SPSS会自动为这些变量的其他属性赋予系统默认值。
Step2:可以进行必要的修改,例如把小数位设为0。也可以为变量加上标签,以对变量的含义进行更详细的说明。在输出结果中可以让SPSS输出变量的标签。
以―班级‖这个变量为例加以说明(图1)。单击―班级‖变量的―Values‖单元格的右侧,会弹出一个―数值标签‖(Value Labels)的对话框。在定义标签对话框的中有三个小矩形框。在第一个矩形框中输入变量值1,在第二个矩形框中输入―统计‖,这时―Add‖按钮变亮,点击Add按钮,下面的清单中显示1=―统计‖。按照这种方法继续定义2=―经济‖,3=―金融‖,4=―会计‖。
变量定义好以后,就可以在数据表中依次输入数据了。对于定义了数值标签的变量,单击工具栏中的值。
10
按钮可以显示数值标签,再单击一下则可以显示数