第五章 概率及概率分布
以随机事件在大重复试验中出现的稳定频率值作为随机事件概率的估计值,这样寻得的概率称为后验概率。
先验概率是在特定条件下直接计算出来的,是随机事件的真实概率,不是由频率估计出来的。
概率的性质:任何随机事件的概率都是在0与1之间0?不可能事件的概率等于0,必然事件的概率等于1 第二节 二项分布
凡满足以下条件的试验称为二项试验: 一次试验只有两种可能结果,即成功和失败,各次试验相互独立,即各次试验之间互不影响。各次试验中成功的概率相等,各次试验中失败的概率也相等。二项分布是一种离散型随机变量的概率分布。 二项分布函数:PXP?1
?CnXpqXn?X?n!X!?n?X?!pqXn?X 二项分布的平均数和标准差:当二项分
?np布接近正态分布时,在n次二项试验中成功事件出现次数的平均数为?为??npq标准差
,二项分布的应用:除了用来求成功事件恰好出现X次的概率之外,在教
育中主要用来判断试验结果的机遇性与真实性的界限。 正态分布是一种连续型随机变量概率分布。正态曲线的函数:Y正态曲线的特点:曲线在Z=0(X?Md?N?X???2?2?e2?2
?M0)处为最高点。曲线以Z=0处为中心
双侧对称。曲线最高点向左右缓慢下降,并无限伸延,但永不与基线相交。标准正态分布上的平均数为0标准差为1,基线上Z从-3至+3,6个标准差距离间几乎包含了全部(99.73%)面积,曲线从最高点向左右延伸时,在正负1个标准差之内既向下又向内弯,正负1个标准差开始,既向下又向外弯。
正态曲线在测验记分方面的应用:1、将原始分数转换成标准分数。标准分数的优点:各科标准分数的单位是绝对等价的;标准分数的数值大小和正负,可以反映某一考分在团体中所处的位置;确定录取分数线;确定等级人数;品质评定数量化。
第六章 抽样分布及总体平均数推断
平均数抽样分布的几个定理:1、从总体中随机抽出容量为n的一切可能样本的平均数之平均数等于总体平均数2、容量为n的平均数在抽样分布上的标准差,等于总体标准差除以n的平方根。?X??n 3、从服从正态分布的总体中,随机抽取的容量
为n的一切可能样本平均数的分布也呈正态分布。4、虽然总体不呈正态分布,如果样本容量较大,反映总体?和?的样本平均数的抽样分布也接近于正态分布。当总体标准差为已知时,平均数抽样分布的标准差与样本容量n的平方根成反比,即样本容量越大,平均数抽样分布的标准差越小,当样本容量n确定时,平均数抽样分布标准差与总体标准差成正比,即总体数值离差程度越大,平均数抽样分布的标准差越大。抽样分布是统计推断的理论依据。某种统计量在抽样分布上的标准差称为该种统计量的标准误。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大,所以标准误是统计推断可靠性的指标。
样本平均数与总体平均数离差统计量的形态:
Z?X????X??
X?nt分布与正态分布的相似之处:t分布基线上的t值从-?-+?;从平均数等于0处,
左侧t值为正;曲线以平均数处为最高向两侧逐渐下降,尾部无限伸延,永不与基线相接,呈单峰对称形。区别之处在于:t分布形态随自由度的变化呈一簇分布形态,
t分布的峰镲尖峭,尾长而翘得高,在基线上分布的范围广,自由度越小,分布范围
越广。当自由度逐渐增大时,t分布逐渐接近正态分布。当自由度趋于无限大时,t分布与正态分布重合。
第二节 总体平均数的估计 根据样本信息对总体参数的有两种不同形式:总体参数估计和假设检验。
总体参数估计的基本原理:根据样本统计量对相应总体参数所作的估计叫总体参数
估计,分为点估计(无偏性、有效性、一致性)和区间估计。当用某一样本统计量的值来估计相应总体参数的值叫点估计。以样本统计量的抽样分布(概率分布)为理论依据,按一定概率要求,由样本统计量的值估计总体参数值的所在范围。
????区间估计:p?X?1.96???X?1.96??0.95
nn??
?X?X??p?X?t?df?0.05???X?t?df?0.05??0.95n?1n?1??
第三节 假设检验的基本原理 利用样本信息,根据一定概率,对总体参数或分布的某一假设作出气绝或保留的决断,称为假设检验。 零假设是关于当前样本所属的总体与假设总体无区别的假设。
备择假设是与零假设相反的假设,是研究者根据样本信息期待证实的假设,是根据样本信息否定了零假设时,应当采取的假设。统计推理采用的是反证法。 小概率事件:样本统计量的值(随机事件)在其抽样分布上出现的概率小于或等于事先规定的水平。显著性水平:统计学中把拒绝零假设的概率。显著性水平越高,越不容易拒绝零假设,推断的可能性就越大。
统计决断的两类错误及其控制:第一类错误:假设真实而被拒绝,第二类错误:假设属伪而被保留。第一类错误的控制通过选择适当的显著性水平加以主动控制。后果非常严重的用较高的显著性水平,0.01 0.005,当拒绝一个属真的假设其后果不是严重的,选用较低的显著性水平 0.05 0.1。控制第二类错误的概率的方法:利用已知的实际总体参数值与假设参数值之间大小关系,合理安排拒绝区域的位置。2、使样本容量增大。 总体平均数的显著性检验
H0 H:??1:?? 右侧检验
Z?X??
t??nX??
?Xn?1第七章 平均数差异的显著性检验 本章是根据两个样本平均数之差检验两个相应总体平均数之差的显著性。根据两个样本统计量的差异检验两个相应总体参数差异的显著性,统计学上称为差异显著性检验。
相关样本平均数差异的显著性检验:两个样本内个体之间存在着一一对应关系,这
两个样本称为相关样本,分为两种情况:配对组和对照组。小样本
t?X1?X2S1?S2?2rS1S2n?X1?X2?1??2?2r?1?2n?122大样本:用Z检验,公式同上。
Z?X121独立样本平均数差异的显著性检验:大样本:
?X?
222??n1n2独立小样本:t?X1?Xn1?1?n2?2222
n1?n2n1n2X1?XS1222n1?n2?2?独立小样本方差不齐性时差异显著性检验:t??2?S12?S2?t?()?t?df2?0.05???n1?(df1)0.05n2???X1?X2n1?S2?12n2n1?1??22
n2?1t?(0.05)?S12n1?S22
n2方差齐性检验:对两个总体的方差是否有显著性差异所进行的检验。 两个独立样本的方差齐性检验:H:?1??22220 H221:?1??222
F?S1S222n1?1?n?222?n12?1??1?
?n2t??1??4?1?222两个相关样本的方差齐性检验:
?1?r?2n?2
第八章 方差分析
基本原理:方差分析的目的:平均数差异的显著性检验,是对两个平均数的比较,在比较多组平均数的时候,常用方差分析综合性地确定几个平均数差异的显著性。方差分析的功能就在于对多组平均数差异的显著性进行检验
方差分析中的几个概念:实验中的自变量称为因素。只有一个自变量的实验称为单因素实验。有两个或两个以上自变量的实验称为多因素实验。某一个因素的不同情况称为因素的水平,包括量差或质别两类情况,按各个水平条件进行的重复实验称为各种处理。假如要研究两种教材及三种教学法对学生学习成绩的影响,该实验是双因素的实验。一个因素是教材,它有两种水平,另一个因素是教学方法,它有三种水平。这个实验称为2*3的实验设计,共有6种处理,若一个实验为2*2*2设计,则表示该实验有三个因素,每个因素有两种水平,共有8种处理。 用方差分析法检验某一因素对因变量的作用,称为单因素方差分析。
完全随机设计的方差分析:为了检验某一个因素多种不同水平间差异的显著性,将从同一个总体中随机抽取的被试,再随机地分入各实验组,施以各种不同实验处理之后,用方差分析法对这多个独立样本平均数差异的显著性进行检验,称为完全随机设计的方差分析。 1、n相等的情况: 组间平方和:SSb组内平方和:SS??X????X? ???22nnKW???X2X2??X? ??2n总平方和:SSt???b???X??nK2
组间自由度:df组内自由度:df?K?1
w?n1?n2?...?K