第十一章 相关分析 第一节 相关的意义
正相关:两个变量的变化方向一一致。负相关:两个变量 的变化方向相反。零相关:两上个变量值变化方向无一定规律。从密切程度来看,无论两个变量的变化方向是否一致,凡密切程度高的称为强相关,一笛膜的为中度相关,弱的为弱相关或低度相关。用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数。r
第二节 积差相关:当两个变量都是连续变量,而且两者之间呈线性关系时,表示这两个变量之间相关。使用条件是:1、两个变量都是由测量获得的连续性数据。2、两个变量的总体都呈正态分布,或接近正态分布,至少是单峰对称。3、必须是成对数据,而且每对数据之间相互独立。4、两个变量之间呈线性关系。5、要排除共变因素的影响。6、样本容量n?30。
积差相关系数:两个变量标准分数乘积之和除以n所得之商。r????x?x??y?y?????x???yn????
相关系数的等距转换及其合并:相关系数不可以直接相加求和,因为它不具有等距的单位。1、将各相关系数r转换成Zr 2、求Zr的平均数相关系数显著性检验的步骤及方法: 一、H0:??0条件下,
Zr???n?3?Z??n?3?
r1、n?50 r的抽样分布接近于正态分布 H0:?
n?50 t?rn?21?r2?0 H0?? Z?rn?11?r2
将r转换成Zr Z??Zr?Z??n?3?
2、 Ho:???0条件下
二、两个相对独立的样本相关系数差异的显著性检验ZZr1?Zr21n1?3?1n2?3
第三节 等级相关:指以等级次序或以等级次序表示的变量之间的相关。主要包括斯皮尔曼二列相关及肯德尔和谐系数。
斯皮尔曼等级相关:当两个变量值以次序或以等级次序表示时,两个相应总体并不一定呈正态分布,样本容量也不一定大于30,表示这两变量之间的相关称为等级相关。虽然X变量可视为正态连续变量,但Y变量是按某种标准评定的等级,故
rR?1?n?n?1?26?D2
1、赋预等级。2、计算两个变量每对所赋予的等级数之差D,及差数的平方之和,即?D2 检验方法:t?rn?21?r2
肯德尔和谐系数:当多个(两个以上)变量值以等级次序排列或以等级次序表示,描述这向个变量之间的一致性程度(即相关)的量。它常用来表示几个评定者对同一组学生学习成绩等级评定的一致性程度,或同一个评定者对同一组学生的学习成绩用等级先后评定多次之间的一致性程度。 无相同等级的情况:
rw?SSR112K2?n3?n? SSR??R2SSR112K2?R???2n
2、有相同等级: rw??n3?n?K?T? T???m
3?m/12?
相关系数的显著性检验:?2?K?n?1?rw第四节 质与量的相关:指一个变量为质,另一个变量为量,这两个变量之间的相关。主要包括二列相关、点二列相关、多系列相关。1、二列相关:当两个变量 都是正态连续变量,其中一个变量被人为地划分成二分变量。使用条件:1、两个变量都是连续变量,且总体呈正态分布,或接近正态分布,至少是单峰对称分布。2、两个变
量之间是线性关系。3、二分变量是人为划分的,其分界点应尽量靠近中值。4、样本容量应当大于80。 二列相关系数的计算:rb?xp?xqpq?tY 检验:Z?rb1Ypqn
2、点二列相关:当两个变量其中一个是正态连续变量,另一个是真正的二分名义变量,有时一个变量虽然并非真正的二分变量,而是双峰分布的变量。 点二列相关系数:rpb?xp?xqpq?t 检验:t?rn?21?r2
3、多系列相关:当两个变量都是正态连续变量,其中一个变量按不同质被人为地分成多种类别(两类以上)的正态名义变量。表示正态连续变量与多类正态名义变量之间的相关。
第五节 品质相关:两个变量都是按质划分成几种类别,数据一般是点计数据。根据两个变量的性质及所分类别的多少,分为四分相关,Φ
一、四分相关:当两个变量都是正态连续变量,且两者呈直线关系,但两者都被人
??0??180rt?cos???1?ad?bc??为地划分成二分变量。
二、Φ相关:当两个变量都是二分变量,无论是真正的二分变量还是人为的二分变量,这两个变量之间的关系,可以用Φ相关来表示,比四分相关要广泛。
r??ab?bc?a?b??a?c??b?d??c?d??Nr?2
检验:?2
三、列联相关:当两个变量均被人为地分成两个以上类别,或其中一个变量被分成两个以上类别。c?df??r?1??c?1?
?22N??先求出
?2??f0? 显著性检验:?N??1??nn?rc??第十二章 回归分析
相关表示两个变量之间的双向相互关系。回归表示一个变量随另一个变量 作不同程度变化的单向关系。由一个变量值估计、预测另一个变量值的准确性,随这两个变量之间的相关程度而变化。在存在相关的情况下,相关越高,由一个变量值预测另一个变量值越准确,误差越小。
第一节 一元线性回归指只有一个自变量的线性回归。
最小二乘方法求回归系数:在配制回归线时,回归系数(b)的确定原则是使散布图上各点距回归线上相应点的纵向距离平方和为最小,这种求b的方法称为最小二乘方法。
求回归系数:由y估计x:b求截距:由x估计y:ayxxy?r??xy 由x估计y:byx?r??yx
?y?byxx 由y估计x:axy?x?bxyy一元线性回归方程检验的方法:1、对回归方程进行方差分析。2、对两个变量的相关系数进行与总体零相关的显著性检验。3、对回归系数进行显著性检验。 检验步骤:1、提出假设:H0:β=0 H1:β≠0 2、计算检验统计量:t?3、确定检验形式: 4、统计决断: 测定系数:r2byx?xn?21?r2由x估计y
?y???y)?(y x和y两个变量相关系数和平方等于回归平方和在总平方(y?y)?22和中所占的比率。
第三节 一元线性回归议程的应用:回归方程主要是用来由自变量的值估计预测因变量的值。这里的估计预测包含两个方面,一方面是用样本的回归方程推算因变量的回归值y ;另一方面是根据样本的回归值y估计预测因变量的真值y。多元线性回
归是指有两个或两个以上自变量的线性回归。