教育统计学考核要点(5)

2019-04-13 21:56

向一条直线汇集的趋势就不明显。

3、相关系数的统计意义

统计学中用来表述变量之间相互关系的概括性量数,称之为相关系数。两两变量之间的相关系数,又称之为简单相关系数。一般情况下,未做特别说明的相关系数是指两两变量之间的简单相关系数。样本相关系数r的统计意义不仅与它的数值大小有关,而且还与它的自由度df?n?2有关,也就是和观察样本的容量n有关。

4、积差相关

两列数据都是等距连续变量的观测数据,并且都是来自于正态分布的数据总体,那么描述这样两列数据之间的相互关系就可以采用积差相关系数。

积差相关系数r??(X?X)(Y?Y)n?SX?SY??XY?n(?X)(?Y)(?X)(?Y)?X?n??Y?n2222

样本相关系数r的显著性检验: (1)提出假设

研究假设H1:??0, 虚无假设是H0:??0; (2)计算检验统计量 t?rn?21?r2

(3)把握显著性水平

计算自由度df?n?2,再查t分布表得t?反之,则P??。 (4)统计决断

同样本平均数差异的显著性检验

5、一元线性回归

只要变量X与变量Y之间存在着显著的线性相关,那么以随机抽取的n个对象的观测结果为坐标的n个散点就会汇集在一条直线附近。一元线性回归分析就是要:(1)建立关于这样一条直线的方程——一元回归方程;(2)检验回归的显著性;(3)利用回归方程,由一个变量(假定的自变量X)去预测另一个变量(假定的因变量Y)。

?a?Y?bX??XY?n(?X)(?Y)。由于样本平均数(X,Y)满??a?bX,其中?回归方程Y?b?2(?X)?2?X?n??(df)。若t?t?(df),则观察到的显著性水平P??。

足回归方程,且回归直线的斜率b?r回归显著性检验:

SYSX??r,故回归方程也可以表示为YSYSX(X?X)?Y

(1)提出假设

研究假设H1:B?0,其意思是总体中的回归系数不等于零,即总体中变量X与变量Y的相关系数??0;

虚无假设是H0:B?0,其意思是总体中的回归系数等于零,即总体中变量X与变量Y的相关系数??0; (2)计算检验统计量 t?rn?21?r2

(3)把握显著性水平

(df)计算自由度df?n?2,再查t分布表得t?。若t?t?(df),则观察到的显著性水平P??。

反之,则P??。 (4)统计决断

同样本平均数差异的显著性检验

??与每一个Xi对应因变量Y的置信度为1??的置信区间为(Y?z??SYXi,Y?z??SYXi),

nn?22其中SYXi?6、等级相关

SY1?r,当n充分大时SYX?SY1?r。 i2只要两列数据都是“顺序”的,就可以采用等级相关的方法来分析变量之间的相互关系。在两列数据都是等距的情况下,我们可以将等距数据转换为顺序数据(等级),再求变量之间的等级相关系数。

等级相关系数的计算公式

rR?1?6?D22n(n?1),其中D?RX?RY。

等级相关显著性检验: (1)提出假设

H1:??0,H0:??0;

(2)计算检验统计量

t?rRn?21?rR2 (3)把握显著性水平

计算自由度df?n?2,再查t分布表得t?(df)。若t?t?(df),则观察到的显著性水平P??。

反之,则P??。 (4)统计决断

同样本平均数差异的显著性检验 7、点二列相关

如果两列数据中,有一列是“真正的二分变量”的数据,而另一列是满足正态分布的等距连续变量的数据,那么,描述这样两个变量之间的线性关系应该采用点二列相关系数。

点二列相关系数的计算公式

rpb?Xp?XqStpq,

其中Xp是二分变量取值为某一类的对象在等距连续变量上的平均数,而p是该类对象在样本中所占的比率;Xq是二分变量取值为另一类的对象在等距连续变量上的平均数,而q是该类对象在样本中所占的比率;St是等距连续变量的样本(合并两类对象)标准差。 点二列相关系数的显著性检验 (1)提出假设

H1:??0,H0:??0;

(2)计算检验统计量 t?rpbn?22

1?rpb(3)把握显著性水平

计算自由度df?n?2,再查t分布表得t?P??。反之,则P??。

(df)。若t?t?(df),则观察到的显著性水平

(4)统计决断

同样本平均数差异的显著性检验 8、二列相关

两列数据中一列是正态分布的等距连续数据,另一列原本也应该是正态分布的等距连续数据,但是,却被人为地划分成“二值”数据。分析这样两个变量之间的线性关系应该采用二列相关方法。

二列相关系数的计算公式

rb?Xp?XqSt?p?qY或rb?Xp?XtSt?pY,

其中Xp是二分变量取值为某一类的对象在等距连续变量上的平均数,而p是该类对象在样本中所占的比率;Xq是二分变量取值为另一类的对象在等距连续变量上的平均数,而q是该类对象在样本中所占的比率;St是等距连续变量的样本(合并两类对象)标准差,Xt是

等距连续变量的样本(合并两类对象)平均数;Y是正态分布曲线被划分为p与q两部分之处的曲线高度。

二列相关系数的显著性检验 (1)提出假设

H1:??0,H0:??0;

(2)计算检验统计量 z?rb?Y?np?q

(3)把握显著性水平

同样本平均数的显著性检验 (4)统计决断

同样本平均数的显著性检验

9、品质相关

如果两列数据都是类别(定性)的,根据这样的资料来分析两个变量之间的相互关系,就应该采用品质相关的方法。

品质相关系数的计算公式

当df?1时,???2N?ad?bc(a?b)(a?c)(b?c)(c?d);

当df?1时,品质相关系数也称为列联相关系数或接触系数,??品质相关系数的显著性检验 ①当df?1时 (1)提出假设

H1:??0,H0:??0;?22??N。

(2)计算检验统计量

??2N(ad?bc)2(a?b)(a?c)(b?c)(c?d)

(3)把握显著性水平

同自由度df?1的?独立性检验 (4)统计决断

同自由度df?1的?独立性检验 ②当df?1时

22

同?2独立性检验 10、偏相关

不涉及任何其他变量,仅由两列数据(譬如?1与?2)直接计算得到的相关系数(记作

r12),称作为这两个变量的简单相关系数。

在剔除了一个其他变量(譬如?3)的影响之后,变量?1与?2之间所余下的相关称作为一阶偏相关,而把这样的一阶偏相关系数记作r12,3。

如果是剔除了二个其他变量(譬如?3和?4)的影响,那么变量?1与?2之间所余下的相关称作为二阶偏相关,并且把这样的二阶偏相关系数记作r12,34。

不难理解,在剔除了k个其他变量的影响之后,原来两个变量之间所余下的相关称作为k阶偏相关;而两个变量的简单相关又被称作为零阶偏相关。 一阶偏相关系数r12,3?r12?r13?r231?r213,

2231?r二阶偏相关系数r12,34?r12,3?r14,3?r24,31?r214,31?r224,3。


教育统计学考核要点(5).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:精选高考数学二轮复习疯狂专练14基本初等函数1理

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: