16.1.2 实现方法分析......... 464 16.1.3 具体操作步骤......... 465 16.2 不同制剂的药效分析........ 473 16.2.1 实例内容说明......... 473 16.2.2 实现方法分析......... 473 16.2.3 具体操作步骤......... 474
16.3 同种药物在不同治疗阶段的药效分析......... 481 16.3.1 实例内容说明......... 481 16.3.2 实现方法分析......... 481 16.3.3 具体操作步骤......... 483
16.4 本章小结.......................... 487
《SPSS 17中文版统计分析典型实例精粹》:以经典统计学软件SPSS 17中文版为写作平台,提供软件命令的中英对照
基础篇学习软件基本操作和统计描述知识,实例篇详解案例应用原理、流程和操作技巧
36个实例典型、丰富,涉及调查统计、市场研究、企业/政府数据分析和医学统计领域
循序渐进、由浅入深,围绕SPSS应用的原理、流程和操作技巧娓娓阐述 插图:
1.3 SPSS的运行方式
SPSS提供了三种基本的运行方式:完全窗口菜单运行方式、程序运行方式和批处理方式。
完全窗口菜单运行方式简单明了,除人工输入数据需要键盘外,大部分的操作命令、统计分析方法的实现都是通过菜单、图标按钮和对话框来完成的,使用者无需掌握编程知识就可以使用SPSS软件,适用于传统的统计分析人员。
程序运行方式和批处理方式则是从使用者特殊的分析需求出发,编写SPSS命令程序,通过语句直接运行的。这两种运行方式要求使用者掌握专业的SPSS编程语法,对使用者的要求较高。
1.4 SPSS的主要界面 1.4.1 SPSS的启动
SPSS安装完毕后,系统会自动在Windows的【开始】菜单下创建快捷方式。打开【开始】菜单,在“SPSS for Windows”下选中“SPSSl7.0 for Windows”并单击,即可启动SPSS。
当用户运行SPSS软件后,计算机屏幕上会出现一个SPSS启动操作对话框,如图1.10所示。在该对话框中,用户可以选择打开数据的方式。对话框中包括一个六选一的单选按钮组和一个复选框,分别说明如下:
“您希望做什么?(What would you like to do?)”单选按钮组 运行教程(Runthetutorial):单击选中后,SPSS将打开帮助教程,在教程中,用户可选择不同模块的帮助说明进行有针对性的辅导。 输入数据(Type in data):需要手动输入数据,建立新的数据文件时可选择此项。选中后,即进入空白的SPSS数据编辑窗口。 运行现有查询(Run an existing query):选中后,可以选择查询文件(.spq)的位置,并可单击打开。
第3章 SPSS基础统计描述 SPSS基础统计描述是进行统计分析的基础和前提。使用一些数学统计量来直观地描述原始数据的集中程度、离散状况和分布情况,之后就可以对数据的总体特征进行较为准确的归纳,从而便于选择合适的统计分析方法。基础统计描述主要包括数据描述、频数分析、探索分析、交叉列联表分析、P-P图、Q-Q图等,下面将具体介绍。 3.1 数理统计量概述
SPSS在描述性统计分析中,提供了多个统计量来描述数据特征,这些统计量包括均值、中位数、众数、方差、标准差、四分位数、十分位数、百分位数、峰度系数、偏度系数等。在进行描述性统计分析之前,首先要对这些统计量在统计学上的定义及其计算公式有所了解。
3.1.1 均值(Mean)和均值标准误差(S.E. Mean)
均值(平均数、平均值)表示的是某个变量所有取值的集中趋势或平均水平。例如,某班学生数学考试的平均成绩、公司员工的平均收入、某年级学生的平均身高、某高校高招录取平均分等。 平均数有总体平均数和样本平均数之分。
总体平均数:若一组数据X1,X2,??,XN代表一个大小为N的有限总体,则其总体平均数为:
(3.1)
样本平均数:若一组数据x1,x2,??,xn代表一个大小为n的有限样本,则其样本平均数为:
(3.2)
样本数据是从总体数据中抽取出来的,但在不同次抽样中得到的样本是不同的。虽然在一定程度上,样本数据可以反映总体数据的特征,但由于抽样等原因,样本数据是总体数据的随机变量。同样,虽然样本均值可以反映总体数据的特征,但在不同次抽样中所得的样本均值是不同的,并且它们与总体均值间存在差异。
均值标准误差(Standard Error of Mean,S.E. Mean,简称标准误)就是描述这些样本均值与总体均值之间平均差异程度的统计量。 3.1.2 中位数(Median)
中位数是将总体数据的各个数值按大小顺序排列,居于中间位置的变量,用Median表示。中位数将所有的数据等分成两半,中位数两端的数据个数相同,因此它也被称为二分位数。中位数的确定,仅仅取决于它在数列中的位置,不受极端值的影响,因此可以用它表示总体的一般水平。同时,中位数比算术平均数具有更好的稳定性。
一个大小为N的数列,要求其中位数,首先应把该数列按大小顺序排列,如果N为奇数,那么该数列的中位数就是是该数列中第
与第
位置上的数;如果N为偶数,中位数则
位置上的两个数值的平均数。
3.1.3 众数(Mode)
众数是指总体数据中出现次数最多的变量,用Mode表示。它同样不受数据极端值的影响,从而在一定程度上提高了平均水平的代表性。例如,制衣厂可以根据消费者所需服装尺码的众数来安排生产。此外,如果众数的值出现的频数或频率较大,那么说明众数的代表性就越高,数列的集中趋势也就越显著。
确定众数没有明确的公式,一般只能用手工统计,故较为烦琐。SPSS所提供的统计功能可以减少诸如此类烦琐的过程。
众数、中位数与算术平均数之间存在一定的关系,这种关系决定于总体分布的状况。当总体分布呈对称的钟形分布时,算术平均数位于分布曲线的对称点上,而该点又是曲线的最高点和中心点,因此,众数、中位数和算术平均数三者相等。当总体分布呈非对称的钟形分布时,由于这三种平均数受极端数值影响程度的不同,因而它们的数值就存在一定的差别,但三者之间仍有一定的关系。当分布右偏时,算术平均数受偏高数值影响较大,其位置必然在众数之右,中位数在众数与算术平均数之间。反之,当次数分布左偏时,算术平均数受偏小数值的影响较大,其位置在众数之左,中位数仍在众数与算术平均数之间。 以上的均值、中位数和众数都是反映数据集中趋势的统计量。 3.1.4 全距(Range)
全距,又称极差,是数据的最大值(Maximum)与最小值(Minimum)之间的绝对差,借以表明总体标志值最大可能的差异范围。全距越长,说明数据越离散;反之,全距越小,说明数据越集中。 用符号表示全距的计算公式为:
(3.3)
全距的缺点在于其方法过于粗略,因为它只考虑总体两端数值的差异,没有考虑中间数值差异的情况,因而它是测定离散程度的一种粗略的方法,不能全面反映总体数据的差异程度。要充分利用每一个数据的信息,就需要利用方差和标准差。
3.1.5 方差(Variance)和标准差(Standard Deviation)
方差是总体所有变量值与其算术平均数偏差平方的平均值,它表示了一组数据分布的离散程度的平均值。标准差是方差的平方根,它表示了一组数据关于平均数的平均离散程度。总体方差公式:
(3.4)
总体标准差公式: