第七章 假设检验
第一节 二项分布
二项分布的数学形式·二项分布的性质 第二节 统计检验的基本步骤
建立假设·求抽样分布·选择显著性水平和否定域·计算检验统计量·判定 第三节 正态分布
正态分布的数学形式·标准正态分布·正态分布下的面积·二项分布的正态近似法
第四节 中心极限定理
抽样分布·总体参数与统计量·样本均值的抽样分布·中心极限定理 第五节 总体均值和成数的单样本检验
σ已知,对总体均值的检验·学生t分布(小样本总体均值的检验)·关于总
体成数的检验
一、填空
1.不论总体是否服从正态分布,只要样本容量n足够大,样本平均数的抽样分布就趋于( 正态 )分布。
2.统计检验时,被我们事先选定的可以犯第一类错误的概率,叫做检验的( 显著性水平 ),它决定了否定域的大小。
3.假设检验中若其他条件不变,显著性水平的取值越小,接受原假设的可能性越( 大 ),原假设为真而被拒绝的概率越( 小 )。
4.二项分布的正态近似法,即以将B(x;n,p)视为N( np ,npq) 查表进行计算。
二、单项选择
1.关于学生t分布,下面哪种说法不正确( B )。
A 要求随机样本 B 适用于任何形式的总体分布 C 可用于小样本 D 可用样本标准差S代替总体标准差? 2.二项分布的数学期望为( C )。
A n(1-n)p B np(1- p) C np D n(1- p)。
3.处于正态分布概率密度函数与横轴之间、并且大于均值部分的面积为( D )。
A 大于0.5 B -0.5 C 1 D 0.5。 4.假设检验的基本思想可用( C )来解释。
A 中心极限定理 B 置信区间 C 小概率事件 D 正态分布的性质 5.成数与成数方差的关系是(D)。
A 成数的数值越接近0,成数的方差越大
1
B 成数的数值越接近0.3,成数的方差越大
C 成数的数值越接近1,成数的方差越大 D 成数的数值越接近0.5,成数的方差越大
6.在统计检验中,那些不大可能的结果称为( D )。如果这类结果真的发生了, 我们将否定假设。
A 检验统计量 B 显著性水平 C 零假设 D 否定域
7.对于大样本双侧检验,如果根据显著性水平查正态分布表得Zα/2=1.96,则当零假设被否定时,犯第一类错误的概率是( C )。 A 20% B 10% C 5% D.1%
8.关于二项分布,下面不正确的描述是( A )。
A 它为连续型随机变量的分布;
B 它的图形当p=0.5时是对称的,当p≠ 0.5时是非对称的,而当n愈大 时非对称性愈不明显;
C 二项分布的数学期望E(X)=?=np,变异数D(X)=?2=npq; D 二项分布只受成功事件概率p和试验次数n两个参数变化的影响。
三、多项选择
1.关于正态分布的性质,下面正确的说法是( AB )。
A 正态曲线以x??呈钟形对称,其均值、中位数和众数三者必定相等。 B 对于固定的?值,不同均值?的正态曲线的外形完全相同,差别只在于曲线在横轴方向上整体平移了一个位置。
C 对于固定的?值,不同均值?的正态曲线的外形完全相同,差别只在于曲线在横轴方向上整体平移了一个位置。
D 对于固定的?值, ?值越大,正态曲线越陡峭。
2.下列概率论定理中,两个最为重要,也是统计推断的数理基础的是( CD )
A 加法定理 B 乘法定理 C 大数定律 D 中心极限定理 E 贝叶斯定理。
3.统计推断的具体内容很广泛,归纳起来,主要是( BE )问题。
A 抽样分布 B 参数估计 C 方差分析 D 回归分析 E 假设检验
4.下列关于假设检验的陈述正确的是( ACDE )。
A 假设检验实质上是对原假设进行检验;
B 假设检验实质上是对备择假设进行检验;
C 当拒绝原假设时,只能认为肯定它的根据尚不充分,而不是认为它绝对错误; D假设检验并不是根据样本结果简单地或直接地判断原假设和备择假设哪一个更有可能正确;
E 当接受原假设时,只能认为否定它的根据尚不充分,而不是认为它绝对正确
2
5.选择一个合适的检验统计量是假设检验中必不可少的一个步骤,其中“合适”实质上是指( ACE )
A 选择的检验统计量应与原假设有关; B 选择的检验统计量应与备择假设有关;
C 在原假设为真时,所选的检验统计量的抽样分布已知;
D 在备择假设为真时,所选的检验统计量的抽样分布已知; E 所选的检验统计量的抽样分布已知,不含未知参数。 6.关于t检验,下面正确的说法是( BD )。
A t检验实际是解决大样本均值的检验问题;
B t检验实际是解决小样本均值的检验问题; C t检验适用于任何总体分布;
D t检验对正态总体适用; E t检验要求总体的?已知。
四、名词解释
1.零假设:
概率分布的具体形式是由假设决定的,假设肯定不止一个。在统计检验中,通常把被检验的那个假设称为零假设(或称原假设,用符号H0表示),并用它和其他备择假设(用符号H1表示)相对比。 2.第一类错误:
零假设Ho实际上是正确的,却被否定了。
3.第二类错误:
零假设Ho实际上是错误的,却没有被否定。
4.显著性水平:
能允许犯第一类错误的概率叫做检验的显著性水平,它决定了否定域的大小。
5.总体参数:
6.检验统计量:
检验统计量是关于样本的一个综合指标,但与参数估计中讨论的统计量有所不同,它不用作估测,而只用作检验。 7.中心极限定理:
如果从一个具有均值?和方差?2的
量为n 的随机样本,那么当n 变得很大时,样本均值的抽样分布接近正态,并具有均值?和方差?/n 。
2
五、判断题
1.在同样的显著性水平的条件下,单侧检验较之双侧检验,可以在犯第一类错误的危险不变的情况下,减少犯第二类错误的危险。 ( √ )
2.统计检验可以帮助我们否定一个假设,却不能帮助我们肯定一个假设。 ( √ )
3.检验的显著性水平(用?表示)被定义为能允许犯第一类错误的概率,它决定了否定域的大小。 ( √ )
3
4.第一类错误是,零假设H0实际上是错的,却没有被否定。第二类错误则是,零假设H0实际上是正确的,却被否定了。 ( × )
5.每当方向能被预测的时候,在同样显著性水平的条件下,双侧检验比单侧检验更合 适。 ( × )
六、计算题
1.根据统计,北京市初婚年龄服从正态分布,其均值为25岁,标准差为5岁,问25岁到30岁之间结婚的人;其百分数为多少? 【84.13%】
2.共有5000个同龄人参加人寿保险,设死亡率为0.1%。参加保险的人在年初应交纳保险费10元,死亡时家属可领2000元。求保险公司一年内从这些保险的人中,获利不少于30000元的概率。 【98.75%】
3.为了验证统计报表的正确性,作了共50人的抽样调查,人均收入的结果有:问能否证明统计报表中人均收入μ=880元是正确的(显著性水平αX?871元,S?21元,=0.05)。 【不能,因为Z=-3.03<-1.96,所以否定原假设μ=880】 4.某单位统计报表显示,人均月收入为3030元,为了验证该统计报表的正确性,作了共100人的抽样调查,样本人均月收入为3060元,标准差为80元,问能否说明该统计报表显示的人均收入的数字有误(取显著性水平α=0.05)。
【可以,因为Z=3.75〉1.96,所以可以拒绝原假设μ=3030,即可以认为统计报表有误】
S?3(岁)X?23.5(岁)5.已知初婚年龄服从正态分布,根据9个人的抽样调查有:,。
问是否可以认为该地区平均初婚年龄已超过20岁(α=0.05)?
【可以,因为t=3.2998〉2.821,所以可以拒绝原假设μ=20,可以认为平均初婚年龄已超过20岁】
6.某地区成人中吸烟者占75%,经过戒烟宣传之后,进行了抽样调查,发现了100名被调查的成人中,有63人是吸烟者,问戒烟宣传是否收到了成效?(α=0.05)【H??0.75,H1?0.75。?=0.05,Z??1.65。Z?0.63?0.750.75*0.25*/100=-2.77<-1.65.所以
拒绝原假设,接受备择假设。】
7.据原有资料,某城市居民彩电的拥有率为60%,现根据最新100户的抽样调查,彩电的拥有率为62%。问能否认为彩电拥有率有所增长?(α=0.05)
【不能,因为Z=0.408<1.65,所以接受原假设p=60%,不能认为彩电拥有率有所增长】 8.一个社会心理学家试图通过实验来表明采取某种手段有助于增加群体的凝聚力。但有16个小组,将它们配对成一个实验组和控制组,实验组和控制组各有8个小组,问怎样用二项分布去检验无效力的零假设,列出检验所需的零假设,计算抽样分布,用显著水平0.05,请指出否定域。
【在社会研究的实验法中,此为“双组实验设计”,其步骤是:1)用匹配或随机指派的方法将实验对象一半分到控制组一半分到实验组;2)对实验组实施实验刺激但不对控制组实施这种刺激;3)然后同时对控制组和实验组进行测量,即后测;4)在比较和分析两个组后测结果之间的差别,得出实验刺激的影响。由此,我们先将16个组两两匹配,得到8个
4
配对组(要使每个配对组在除实验变量之外的其他方面尽量相似)。然后在每个配对组中任取一组安排于实验组,另一组安排于控制组。接着,在4-8年的时间内,让分到实验组的8组人接受某种手段,如共同游戏,而控制组的8组人则没有这样做。而后对每个配对组分别进行后度测量,并用“+”号表示实验组比控制组好的那些配对组,用“-”表示实验组比控制组差的那些配对组。除非度量方法很粗燥,每配对组应该都能判断出差异。这样便可以用二项分布做实验无效的检验了。
H0:p=0.5,H1:p>0.5,选用0.1的显著性水平。P?7??P?8??0.0391?0.1,
P?6??P?7??P?8??0.1836>0.1,所以否定域由7个“+”和8个“+”组成,即对每配对组进
行后测度量,如出现7个“+”和或8个“+”时,在0.1的显著性水平上,我们将否定零假设,说明实验有效。否则就不能否定零假设,也就是说实验无效】
9.孟德尔遗传定律表明:在纯种红花豌豆与白花豌豆杂交后所生的,子二代豌豆中,红花对白花之比为3:1。某次种植试验的结果为:红花豌豆352株,白花豌豆96株。试在?=0.05的显著性水平上,检定孟德尔定律。
352?34【H?:p?34,H1:p?34。??0.05,Z??1.96,Z?2352+9634*14=1.75<1.96,
/?352+96?所以保留原假设】
10.一个样本容量为50的样本,具有均值10.6和标准差2.2,要求: 1)请用单侧检验,显著性水平0.05检验总体均值为10.0的假设;
【1.65<1.928,所以否定原假设,接受备择假设均值为10.6】
2)请用双侧检验,显著性水平0.05检验总体均值为10.0的假设;
【1.928<1.96,所以不能否定原假设,仍接受总体均值为10.0】
3)请比较上述单、双侧检验犯第一类错误和犯第二类错误的情况。
【在方向可知时,同样犯第一类错误概率的情况下,单侧检验比双侧检验能减少犯第二类错误的概率】
11.设要评价某重点中学教学质量情况,原计划升学率为60%,在高校录取工作结束后,现在一个由81个学生组成的随机样本中,发现升学率55%,用显著性水平为0.02,你能否就此得出该校的工作没有达到预期要求的结论。为什么?
【-0.918>-1.65,所以不能否认原假设p=60%】
29292012.在重复抛掷一枚硬币49次的二项试验中,试求成功29次的概率? 【C490.50.5】
13.某市2003年居民的户均收入是3500元,为了了解该市居民2004年的收入情况,有关调查部门作了一个共100户的收入情况的抽样调查,样本户均月收入为3525,标准差为100元。据此,你有多大把握说该市居民户均收入是增加了。
【在?=0.05进行双侧检验时,Z=2.5>1.96,有95%的把握】
14.某单位共有5名孕妇,求以下概率(设婴儿性别男为22/43,21/43):
?22??21?3?22??21?C(1)全为男婴;(2)全为女婴;(3)3男2女。【?】【】【???】 5????4343?????43??43?
5
5532
15.某地区回族占全体居民人数的6%,今随机抽取10位居民,问其中恰有2名是回族的概率是多少? 【0.099】
16.工人中吸烟的比例为0.5%。某车间有工人300名,求以下概率:
(1)全部吸烟;(2)2人吸烟;(3)100人吸烟; (4)160人吸烟。
003002289200100100200003【C300】【C】【C】【C】 0.50.950.50.950.50.950.50.9500300300317.某工厂总体的10%是技术人员,求7人委员会中4人是技术员的概率,并指出检验所需的假设。 【p=0.26%,H??0.1,H1?0.1】
18.设某股民在股票交易中,每次判断正确的概率是60%。该股民最近作了100次交 易。试求至少有50次判断正确的概率。 【0.9793】 19.某市去年的数字显示:进城农民工参加社保的比例是30%。今年在进城农民工中
随机抽取400人进行调查,经计算得该样本总体的参保率为33%,试在?=0.05的显著性水平上,检定“今年该市农民工参保情况有了改进”的零假设。 【单侧检验时,
Z=1.31<1.65,所以不能否定原假设,即不能认为今年农民工参保情况有了改进】
2
20.根据调查,儿童的智商分布为N(100,10),某幼儿园共有儿童250名,问智商
在110 ~ 120之间的儿童共有多少名? 【34】
21.根据调查,女大学生的身高分布为N(163,62),某大学共有女大学生1500名,问身高在164 ~ 168厘米之间的女大学生共有多少名? 【343】
七、问答题
1.简述中心极限定理。
中心极限定理的具体内容是:如果从任何一个具有均值μ和方差σ2的总体(可以具有任何分布形式)中重复抽取容量为n的随机样本,那么当n变得很大时,样本均值X的抽样分
布接近正态,并具有均值μ和方差
?n2。
2.试述正态分布的性质与特点。
(1)正态曲线以X=μ呈钟形对称,其均值、中位数和众数三者必定相等。
(2) ?(X=x)在X=μ处取极大值。X离μ越远,?(X=x)值越小。这表明对于同样长度的区间,当区间离μ越远,X落在这个区间的概率越小。正态曲线以X铀为渐近线,即?(X=x)在| X |无限增大时趋于零,即lim?(x)=0或lim?( x)=0。
x???x??? (3)对于固定的σ值,不同均值μ的正态曲线的外形完全相同,差别只在于曲线在横轴方向上整体平移了一个位置(参见图7.3)。
(4)对于固定的μ值,改变σ值,σ值越小,正态曲线越陡峭;σ值越大,正态曲线越低平(参见图7.4)。
(5)正态分布的数学期望E(X)=μ,变异数D(X)=σ2,
6
7