SPPS使用指南(7)

2018-12-11 22:56

0 1 0

6 19 11

0 1 1

18 22 20

1 0

18 11

在SPSS 中估计参数步骤如下:

(1)在SPSS 中录入上表中数据(变量为Y 和X),并保存数据文件;在主菜单中选择[Analyze]=>[Regression]=>[Binary Logistic]。

(2)在[Logistic Regression]对话框中,选择Y 进入[Dependent]框作为因变量,选择X 进入

[Covariates]作为自变量(如图4.4所示)。单击[Method]的下拉菜单,SPSS 提供了7 种方法:

[Enter]:所有自变量强制进入回归方程;

[Forward: Conditional]:以假定参数为基础作似然比检验,向前逐步选择自变量; [Forward: LR]:以最大局部似然为基础作似然比检验,向前逐步选择自变量; [Forward: Wald]:作Wald 概率统计法,向前逐步选择自变量;

[Backward: Conditional]:以假定参数为基础作似然比检验,向后逐步选择自变量; [Backward: LR]:以最大局部似然为基础作似然比检验,向后逐步选择自变量; [Backward: Wald]:作Wald 概率统计法,向后逐步选择自变量。 本例选默认项[Enter]方法。

图4.4 Logistic Regression主对话框

(3)单击[Logistic Regression]对话框中的[Options]按钮,显示子对话框如图4.5,在子

对话框中选择[Classification plots]和[Hosmer-Lemeshow等选项,并单击Continue]返回主对话框。

图4.5 Logistic Regression]对话框中的[Options]按钮子对话框

(4)单击主对话框中[OK]按钮,输出结果如下:

下面解释上面结果的一些常用的检验统计量: 1、-2 对数似然值(-2 log likelihood,-2LL)

似然(likelihood)即概率,特别是由自变量观测值预测因变量观测值的概率。与任何概率一样,似然的取值范围在0、1 之间。对数似然值(log likelihood,LL)是它的自然对数形式,由于取值范围在[0,1]之间的数的对数值负数,所以对数似然值的取值范围在0 至-∞之间。对数似然值通过最大似然估计的迭代算法计算而得。因为-2LL 近似服从卡方分布且在数学上更为方便,所以-2LL 可用于检验Logistic 回归的显著性。-2LL 反映了在模型中包括了所有自变量后的误差,用于处理因变量无法解释的变动部分的显著性问题,又称为拟合劣度卡方统计量(Badness-of-fit Chi-square)。当-2LL 的实际显著性水平大于给定的显著性水平α时,因变量的变动中无法解释的部分是不显著的,意味着回归方程的拟合程度越好。-

2、Cox 和Snell 的R2(Cox & Snell’s R-Square)

Cox 和Snell 的R2试图在似然值基础上模仿线性回归模型的R2解释Logistic 回归模型,但它的最大值一般小于1,解释时有困难。

3、Nagelkerke 的R2(Nagelkerke’s R-Square)

为了对Cox 和Snell 的R2 进一步调整,使得取值范围在0 和1 之间,Nagelkerke 把Cox和Snell 的R2 除以它的最大值。

4、Hosmer 和Lemeshow 的拟合优度检验统计量(Hosmer and Lemeshow's Goodness of Fit

Test Statistic)

与一般拟合优度检验不同,Hosmer 和Lemeshow 的拟合优度检验通常把样本数据根据预测概率分为十组,然后根据观测频数和期望频数构造卡方统计量(即Hosmer 和Lemeshow 的拟合优度检验统计量,简称H-L 拟合优度检验统计量),最后根据自由度为8的卡方分布计算其p 值并对Logistic 模型进行检验。如果该p 值小于给定的显著性水平α(如α=0.05),则拒绝因变量的观测值与模型预测值不存在差异的零假设,表明模型的预测值与观测值存在显著差异。如果p 值大于α,我们没有充分的理由拒绝零假设,表明在可接受的水平上模型的估计拟合了数据。

5、Wald 统计量

同线性回归方程的参数显著性检验似,Wald 统计量用于判断一个变量是否应该包含在模型中,Wald 统计量近似服从于自由度等于参数个数的卡方分布。判断变量是否显著类似于线性回归。

五、非参数检验

非参数检验,是不依赖总体分布的统计推断方法,是指在总体不服从正态分布且分布情况不明时,用来检验数据资料是否来自同一个总体假设的一类检验方法。由于这些方法一般不涉及总体参数而得名。这类方法的假定前提比参数检验方法少得多。也容易满足,适用于计量信息较弱的资料且计算方法也简单易行,所以在实际中有广泛的应用。

下面以SPSS为例介绍非参数检验的具体应用。在SPSS中,几乎所有的非参数分析方法都被放入了Nonparametric Tests菜单中,具体来讲有以下几种:

? Chi-square test:用卡方检验来检验变量的几个取值所占百分比是否和我们期望

的比例没有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%,)。

?

Binomial Test:用于检测所给的变量是否符合二项分布,变量可以是两分类的,

也可以使连续性变量,然后按你给出的分界点一刀两断。

?

Runs Test:用于检验某变量的取值是否是围绕着某个数值随机地上下波动,该数

值可以是均数、中位数、众数或人为制定。一般来说,如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。

?

One-Sample Kolmogorov-Smirnov Test:采用柯尔莫诺夫-斯米尔诺夫检验来分析

变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、Poission分布和指数分布。

? ?

Two-Independent-Samples Tests:即成组设计的两样本均数比较的非参数检验。 Tests for Several Independent Samples:成组设计的多个样本均数比较的非参

数检验,此处不提供两两比较方法。

5.1.卡方检验(Chi-square test) 5.1.1.卡方检验步骤

假设一个定性变量Y 具有k 个可能取值或有k 种分类(标为1,2,.,k),Y 的概率分布自然地由概率函数P(Y=i)(i=1,2,.,k)所确定。现在要考查已观察到的一组样本(容量为n)与某确定的分布G 拟合的程度,相当于研究P(Y=i)(i=1,2,.,k)与G 之间的差异,看这个差异是否属于偶然变异,根据原假设认为差异是偶然变异所致这样的原则,卡方检验的步骤如下:

1、提出假设

H0:P(Y=i)=Gi (i=1,2,.,k ,Gi 为G 分布) H1:P(Y=i)≠Gi 2、构造统计量

?Q?Ei???2?2??i?k?1?

ki?12Ei其中,Qi 为观测频数,期望频数i Ei?nk


SPPS使用指南(7).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:浅论乡镇基层领导干部应具备的素质

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: