向一条直线汇集的趋势就不明显。
3、相关系数的统计意义
统计学中用来表述变量之间相互关系的概括性量数,称之为相关系数。两两变量之间的相关系数,又称之为简单相关系数。一般情况下,未做特别说明的相关系数是指两两变量之间的简单相关系数。样本相关系数r的统计意义不仅与它的数值大小有关,而且还与它的自由度df?n?2有关,也就是和观察样本的容量n有关。
4、积差相关
两列数据都是等距连续变量的观测数据,并且都是来自于正态分布的数据总体,那么描述这样两列数据之间的相互关系就可以采用积差相关系数。
积差相关系数r??(X?X)(Y?Y)n?SX?SY??XY?n(?X)(?Y)(?X)(?Y)?X?n??Y?n2222
样本相关系数r的显著性检验: (1)提出假设
研究假设H1:??0, 虚无假设是H0:??0; (2)计算检验统计量 t?rn?21?r2
(3)把握显著性水平
计算自由度df?n?2,再查t分布表得t?反之,则P??。 (4)统计决断
同样本平均数差异的显著性检验
5、一元线性回归
只要变量X与变量Y之间存在着显著的线性相关,那么以随机抽取的n个对象的观测结果为坐标的n个散点就会汇集在一条直线附近。一元线性回归分析就是要:(1)建立关于这样一条直线的方程——一元回归方程;(2)检验回归的显著性;(3)利用回归方程,由一个变量(假定的自变量X)去预测另一个变量(假定的因变量Y)。
?a?Y?bX??XY?n(?X)(?Y)。由于样本平均数(X,Y)满??a?bX,其中?回归方程Y?b?2(?X)?2?X?n??(df)。若t?t?(df),则观察到的显著性水平P??。
足回归方程,且回归直线的斜率b?r回归显著性检验:
SYSX??r,故回归方程也可以表示为YSYSX(X?X)?Y
(1)提出假设
研究假设H1:B?0,其意思是总体中的回归系数不等于零,即总体中变量X与变量Y的相关系数??0;
虚无假设是H0:B?0,其意思是总体中的回归系数等于零,即总体中变量X与变量Y的相关系数??0; (2)计算检验统计量 t?rn?21?r2
(3)把握显著性水平
(df)计算自由度df?n?2,再查t分布表得t?。若t?t?(df),则观察到的显著性水平P??。
反之,则P??。 (4)统计决断
同样本平均数差异的显著性检验
??与每一个Xi对应因变量Y的置信度为1??的置信区间为(Y?z??SYXi,Y?z??SYXi),
nn?22其中SYXi?6、等级相关
SY1?r,当n充分大时SYX?SY1?r。 i2只要两列数据都是“顺序”的,就可以采用等级相关的方法来分析变量之间的相互关系。在两列数据都是等距的情况下,我们可以将等距数据转换为顺序数据(等级),再求变量之间的等级相关系数。
等级相关系数的计算公式
rR?1?6?D22n(n?1),其中D?RX?RY。
等级相关显著性检验: (1)提出假设
H1:??0,H0:??0;
(2)计算检验统计量
t?rRn?21?rR2 (3)把握显著性水平
计算自由度df?n?2,再查t分布表得t?(df)。若t?t?(df),则观察到的显著性水平P??。
反之,则P??。 (4)统计决断
同样本平均数差异的显著性检验 7、点二列相关
如果两列数据中,有一列是“真正的二分变量”的数据,而另一列是满足正态分布的等距连续变量的数据,那么,描述这样两个变量之间的线性关系应该采用点二列相关系数。
点二列相关系数的计算公式
rpb?Xp?XqStpq,
其中Xp是二分变量取值为某一类的对象在等距连续变量上的平均数,而p是该类对象在样本中所占的比率;Xq是二分变量取值为另一类的对象在等距连续变量上的平均数,而q是该类对象在样本中所占的比率;St是等距连续变量的样本(合并两类对象)标准差。 点二列相关系数的显著性检验 (1)提出假设
H1:??0,H0:??0;
(2)计算检验统计量 t?rpbn?22
1?rpb(3)把握显著性水平
计算自由度df?n?2,再查t分布表得t?P??。反之,则P??。
(df)。若t?t?(df),则观察到的显著性水平
(4)统计决断
同样本平均数差异的显著性检验 8、二列相关
两列数据中一列是正态分布的等距连续数据,另一列原本也应该是正态分布的等距连续数据,但是,却被人为地划分成“二值”数据。分析这样两个变量之间的线性关系应该采用二列相关方法。
二列相关系数的计算公式
rb?Xp?XqSt?p?qY或rb?Xp?XtSt?pY,
其中Xp是二分变量取值为某一类的对象在等距连续变量上的平均数,而p是该类对象在样本中所占的比率;Xq是二分变量取值为另一类的对象在等距连续变量上的平均数,而q是该类对象在样本中所占的比率;St是等距连续变量的样本(合并两类对象)标准差,Xt是
等距连续变量的样本(合并两类对象)平均数;Y是正态分布曲线被划分为p与q两部分之处的曲线高度。
二列相关系数的显著性检验 (1)提出假设
H1:??0,H0:??0;
(2)计算检验统计量 z?rb?Y?np?q
(3)把握显著性水平
同样本平均数的显著性检验 (4)统计决断
同样本平均数的显著性检验
9、品质相关
如果两列数据都是类别(定性)的,根据这样的资料来分析两个变量之间的相互关系,就应该采用品质相关的方法。
品质相关系数的计算公式
当df?1时,???2N?ad?bc(a?b)(a?c)(b?c)(c?d);
当df?1时,品质相关系数也称为列联相关系数或接触系数,??品质相关系数的显著性检验 ①当df?1时 (1)提出假设
H1:??0,H0:??0;?22??N。
(2)计算检验统计量
??2N(ad?bc)2(a?b)(a?c)(b?c)(c?d)
(3)把握显著性水平
同自由度df?1的?独立性检验 (4)统计决断
同自由度df?1的?独立性检验 ②当df?1时
22
同?2独立性检验 10、偏相关
不涉及任何其他变量,仅由两列数据(譬如?1与?2)直接计算得到的相关系数(记作
r12),称作为这两个变量的简单相关系数。
在剔除了一个其他变量(譬如?3)的影响之后,变量?1与?2之间所余下的相关称作为一阶偏相关,而把这样的一阶偏相关系数记作r12,3。
如果是剔除了二个其他变量(譬如?3和?4)的影响,那么变量?1与?2之间所余下的相关称作为二阶偏相关,并且把这样的二阶偏相关系数记作r12,34。
不难理解,在剔除了k个其他变量的影响之后,原来两个变量之间所余下的相关称作为k阶偏相关;而两个变量的简单相关又被称作为零阶偏相关。 一阶偏相关系数r12,3?r12?r13?r231?r213,
2231?r二阶偏相关系数r12,34?r12,3?r14,3?r24,31?r214,31?r224,3。