已知面积(概率)求Z值
⑴.求Z=0以上或以下某一面积对应的Z值:直接查表
⑵.求与正态曲线上端或下端某一面积P相对应的Z值:先用0.5-PZ,再查表 ⑶.求与正态曲线下中央部位某一面积相对应的Z值:先计算P/2,再查表
已知概率P或Z值,求概率密度Y
⑴.直接查正态分布表就能得到相应的概率密度Y值。
⑵.如果由概率P求Y值,要注意区分已知概率是位于正态曲线的中间部分,还是两尾端部分,才能通过查表求得正确的概率密度。 三、概率分布——二项分布 (一)二项试验与二项分布
二项分布(bionimal distribution)是一种具有广泛用途的离散型随机变量的概率分布,它是由贝努里创始的,因此又称为贝努里分布。 1.二项试验
满足以下条件的试验称为二项试验:
? 一次试验只有两种可能的结果,即成功和失败; ? 共有n次试验,并且n是预先给定的任一正整数; ? 各次试验相互独立,即各次试验之间互不影响; ? 各次试验中成功的概率相等,失败的概率也相等。 2.二项分布函数
? 二项分布是一种离散型随机变量的概率分布。
? 用 n 次方的二项展开式来表达在 n 次二项试验中成功事件出现的不同次数(X=0,
1…)的概率分布,叫做二项分布函数。
二项展开式的通式(即二项分布函数):
b(x,n,p)?CnX?pX?qn?X
3、二项分布的平均数和标准差
? 如果二项分布满足p>q且 nq≥5(或者p<q且 np≥5时,二项分布接近于正态分
布。可用下面的方法计算二项分布的平均数和标准差。 ? 二项分布的平均数为: ??npnpq? 二项分布的标准差为: ??4、二项分布的应用
二项分布函数除了用来求成功事件恰好出现X次的概率之外,在教育中主要用来判断试验结果的机遇性与真实性的界限。 四、概率分布——样本分布 (一)、抽样分布
区分三种不同性质的分布:
? 总体分布:总体内个体数值的频数分布 ? 样本分布:样本内个体数值的频数分布 ? 抽样分布:某一种统计量的概率分布 1. 抽样分布的概念
抽样分布是从同一总体内抽取的不同样本的统计量的概率分布。 抽样分布是一个理论的概率分布,是统计推断的依据。 2.平均数抽样分布的几个定理
⑴.从总体中随机抽出容量为n的一切可能样本的平均数之平均数等于总体的平均数。
⑵.容量为n的平均数在抽样分布上的标准差(即平均数的标准误),等于总体标准差除以n的平方根。
? ?X?n
⑶.从正态总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布。 ⑷.虽然总体不呈正态分布,如果样本容量较大,反映总体μ和σ的样本平均数的抽样分布,也接近于正态分布。 (二)标准误
某种统计量在抽样分布上的标准差,称为标准误。标准误用来衡量抽样误差。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。因此,标准误是统计推断可靠性的指标。
平均数标准误的计算
1.总体正态,σ已知(不管样本容量大小),或总体非正态,σ已知,大样本
?平均数的标准误为: ?X?n
2.总体正态,σ未知(不管样本容量大小),或总体非正态,σ未知,大样本
S平均数标准误的估计值为:
?X? n?1(三)平均数离差统计量的分布
1.总体正态,σ已知(不管样本容量大小),或总体非正态,σ已知,大样本
平均数离差的的抽样分布呈正态分布
X??X??Z?? ??X 正态总体,样本平均数的抽样分布 n
?2?X??2?X?
n
2.总体正态,σ未知(不管样本容量大小),或总体非正态,σ未知,大样本
平均数离差的的抽样分布呈t分布 X??X??t?? S?X n?1t分布的特点
⑴.形状与正态分布曲线相似
⑵.t分布曲线随自由度不同而有一簇曲线
⑶.自由度的计算:自由度是指能够独立变化的数据个数。 ⑷.查t分布表时,需根据自由度及相应的显著性水平,并要注意是单侧数据还是双侧。 3.总体σ未知,大样本时的近似处理
样本容量增大后,平均数的抽样分布接近于正态分布,可用正态分布近似处理:
X??X?? Z???S?X
E(X)??n
第七章 参数估计
一、点估计、区间估计与标准误 (一)总体参数估计的基本原理
? 根据样本统计量对相应总体参数所作的估计叫作总体参数估计。 ? 总体参数估计分为点估计和区间估计。
? 由样本的标准差估计总体的标准差即为点估计;而由样本的平均数估计总体平均数
的取值范围则为区间估计。
(二)点估计
1、良好的点估计量应具备的条件
? 无偏性
如果一切可能个样本统计量的值与总体参数值偏差的平均值为0,这种统计量就是总体参数的无偏估计量。
? 有效性
当总体参数不止有一种无偏估计量时,某一种估计量的一切可能样本值的方差小者为有效性高,方差大者为有效性低。
? 一致性
当样本容量无限增大时,估计量的值能越来越接近它所估计的总体参数值,这种估计是总体参数一致性估计量。
? 充分性
一个容量为n的样本统计量,应能充分地反映全部n个数据所反映的总体的信息。 2、点估计量的缺点
有偏差
没有提供正确估计的概率,即不能提供估计值与参数真值的接近程度和可靠程度 (三)区间估计
区间估计可以解决这个问题。区间估计得出的不是一个单一数值,而是一个数值区间。它既可以告诉我们参数的真值在什么范围内,又能告诉我们参数的真值落在这个范围的概率有多大。
区间估计的基础——抽样分布
? 根据抽样分布的特点及原理,不同总体条件下,可能会有不同的抽样分布,则可得
到不同条件下总体参数的区间估计的计算方法。 ? 区间估计涉及和置信区间和显著性水平。 1、区间估计
以样本统计量的抽样分布(概率分布)为理论依据,按一定概率的要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。
对总体参数值进行区间估计,就是要在一定可靠度上求出总体参数的置信区间的上下限。
? ⑴要知道与所要估计的参数相对应的样本统计量的值,以及样本统计量的理论分布; ? ⑵要求出该种统计量的标准误;
? ⑶要确定在多大的可靠度上对总体参数作估计,再通过某种理论概率分布表,找出
与某种可靠度相对应的该分布横轴上记分的临界值,才能计算出总体参数的置信区间的上下限。
置信区间
? 置信度,即置信概率,是作出某种推断时正确的可能性(概率)。
? 置信区间,也称置信间距(confidence interval,CI)是指在某一置信度时,总体
参数所在的区域距离或区域长度。置信区间是带有置信概率的取值区间。
显著性水平
? 对总体平均数进行区间估计时,置信概率表示做出正确推断的可能性,但这种估计
还是会有犯错误的可能。显著性水平(significance level)就是指估计总体参数落在某一区间时,可能犯错误的概率,用符号α表示。
P=1-α
2、平均数区间估计的基本原理
通过样本的平均数估计总体的平均数,首先假定该样本是随机取自一个正态分布的母总体(或非正态总体中的n>30的样本),而计算出来的实际平均数是无数容量为n的样本平均数中的一个。
根据样本平均数的分布理论,可以对总体平均数进行估计,并以概率说明其正确的可能性。
三、总体平均数的估计
(一)总体平均数的区间估计
1.总体平均数区间估计的基本步骤
①.根据样本的数据,计算样本的平均数和标准差; ②.计算平均数抽样分布的标准误; ③.确定置信概率或显著性水平;
④.根据样本平均数的抽样分布确定查何种统计表; ⑤.计算置信区间;
⑥.解释总体平均数的置信区间。 2.平均数区间估计的计算
①总体正态,σ已知(不管样本容量大小),或总体非正态,σ已知,大样本
样本平均数的分布呈正态,平均数的置信区间为:
??X?Z????X?Z? ??nn22
②总体正态,σ未知(不管样本容量大小),或总体非正态,σ未知,大样本
样本平均数的分布为t分布,平均数的置信区间为:
SSX?t?df??????X?t?df???
n?1n?122
③总体正态,σ未知,大样本
平均数的抽样分布接近于正态分布,用正态分布代替t分布近似处理:
SSX?Z?????X?Z??
nn22
④ 总体非正态,小样本
不能进行参数估计,即不能根据样本分布对总体平均数进行估计。
第八章 假设检验
一、假设检验的原理 (一)、假设检验的基本原理
利用样本信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留的决断,称为假设检验。 1、假设
假设检验一般有两互相对立的假设。
? H0:零假设,或称原假设、虚无假设(null hypothesis)、解消假设;是要检验的
对象之间没有差异的假设。 ? H1:备择假设(alternative hypothesis),或称研究假设、对立假设;是与零假设
相对立的假设,即存在差异的假设。
进行假设检验时,一般是从零假设出发,以样本与总体无差异的条件计算统计量的值,并分析计算结果在抽样分布上的概率,根据相应的概率判断应接受零假设、拒绝研究假设还是拒绝零假设、接受研究假设。 2、小概率事件
样本统计量的值在其抽样分布上出现的概率小于或等于事先规定的水平,这时就认为小概率事件发生了。把出现概率很小的随机事件称为小概率事件。
当概率足够小时,可以作为从实际可能性上,把零假设加以否定的理由。因为根据这个原理认为:在随机抽样的条件下,一次实验竟然抽到与总体参数值有这么大差异的样本,可能性是极小的,实际中是罕见的,几乎是不可能的。 3、显著性水平
? 统计学中把拒绝零假设的概率称为显著性水平,用α表示。 ? 显著性水平也是进行统计推断时,可能犯错误的概率。 ? 常用的显著性水平有两个:α=0.05 和 α=0.01。 4.假设检验中的两类错误及其控制
对于总体参数的假设检验,有可能犯两种类型的错误,即α错误和β错误。 假设检验中的两类错误
拒绝H0 接受H0 两类错误 研究结论 拒绝H0 接受H0 实际情况 H0正确 Ⅰ型错误 正确 H0错误 正确 Ⅱ型错误 H0为真 α错误 正确 H0为假 正确 β错误 结论
(1)两类错误既有联系又有区别
?错误只在否定H0时发生
?错误只在接受H0时发生
?错误增加 ? 错误减小 ?错误增加 ? 错误减小
(2)n , ?2 可使两类错误的概率都减小.