4.10 对10名成年人和10名幼儿的身高(cm)进行抽样调查,结果如下:
成年组 166 169 172 177 180 170 172 174 168 173
幼儿组
68
69
68
70
71
73
72
73
74
75
(1)要比较成年组和幼儿组的身高差异,你会采用什么样的侧度值?为什么?
(2)比较分析哪一组的身高差异大? 第五章 概率与概率分布
【重点】掌握离散型概率分布和连续型概率分布。 【难点】区分不同类型随机变量的概率分布。 思考题
5.1 全概率公式和逆概率公式分别用于什么场合? 5.2 基本事件与复合事件。 5.3 概率的分配(计算)方法。
5.4 常用的离散、连续变量的概率分布。
练习题
一、单项选择题
1、根据概率的统计定义,可用以近似代替某一事件的概率的是( )。 A、大量重复试验中该随机事件出现的次数占试验总次数的比重 B、该随机事件包含的基本事件数占样本空间中基本事件总数的比重
C、大量重复随机试验中该随机事件出现的次数
D、专家估计该随机事件出现的可能性大小
2、下列事件中不属于严格意义上的随机事件的是( )。
A、从一大批合格率为90%的产品中任意抽出的一件产品是不合格品 B、从一大批合格率为90%的产品中任意抽出的20件产品都是不合格品 C、从一大批优质品率为15%的产品中任意抽出的20件产品都是优质品 D、从一大批合格率为100%的产品中任意抽出的一件产品是合格品
3、假设A、B为两个互斥事件,则下列关系中,不一定正确的是( )。 A、P(A+B)=P(A)+P(B) B、P(A)=1-P(B)
C、P(AB)=0 D、P(A|B)=0
4、同时抛3枚质地均匀的硬币,巧合有2枚正面向上的概率为( )。
A、0.125 B、0.25 C、0.375 D、0.5 5、下列由中心极限定理得到的有关结论中,正确的是( )。 A、只有当总体服从正态分布时,样本均值才会趋于正态分布 B、只要样本容量n充分大,随机事件出现的频率就等于其概率
C、无论样本容量n如何,二项分布概率都可以用正态分布近似计算
D、不论总体服从何种分布,只要样本容量n充分大,样本均值趋于正态分布 二、多项选择题
1、下列关于随机变量的数学期望的表述中正确的是( )。
A、它又称为随机变量的均值
B、它表示该随机变量所有可能取值的平均水平 C、它度量的是随机变量的离中趋势
15
D、任一随机变量都存在一个有限的数学期望
E、它与加权算术平均数的不同之一是它以概率或分布密度为权数 2、下列关于几种概率分布之间的关系的陈述中,正确的有( ):
A、二点分布(0-1分布)是二项分布的特例
B、当n很大而p又很小时,二项分布可用参数λ=np的泊松分布近似 C、当N很大而M / N很小是,超几何分布趋于二项分布
D、当n>30时,不管p大小,二项分布的概率都可用正态分布来近似计算 E、当n无限增大时,二项分布趋近于正态分布 三、判断分析题(判断正误,并简要说明理由) 1、频率的极限是概率。
2、若某种彩票中奖的概率为5?,那么随机购买1000注彩票将有5注中奖。 四、简答题
1、全概率公式与逆概率公式分布用于什么场合? 五、计算题 1、某厂生产的某种节能灯管的使用寿命服从正态分布,对某批产品测试的结果,平均使用寿命为1050小时,标准差为200小时。试求:
(1)使用寿命在500小时以下的灯管占多大比例? (2)使用寿命在850~1450小时的灯管占多大比例? (3)以均值为中心,95%的灯管的使用寿命在什么范围内? 答案:
一、A,D,B,C,D;
二、ABE; ABCE
三、1、错误。当观察次数n很大时,随机事件发生的频率的稳定值就是概率,频率可作为概率的近似值。但是并不能认为概率就是频率的极限。因为当n很大时,频率稳定地在概率附近摆到,二者出现显著偏差的可能性极小,但并不意味着二者的偏差肯定越来越小。
2、错误。中奖的概率为5?,意味着在试验次数非常多的情况下,平均每1000注彩票大约有5注会中奖。并不意味着每1000注彩票必然有5注中奖。
四、1、全概率公式:某一事件B的发生有各种可能的原因Ai(i=1,2,?,n),每一Ai都可能导致B发生,求B发生的概率。
逆概率公式:在事件B已发生的条件下,寻找导致A发生的每个原因Ai的概率。 五、1、(1)P{X<500}=Φ(
500?1050200)=Φ(-2.75)
=1-Φ(2.75)=1-0.99702=0.00298
(2)P{850≤X≤1450}=Φ(
1450?1050200)- Φ(
850?1050200)
=Φ(2)- Φ(-1)=0.97725-0.15865=0.8186
(3) 由标准正态函数分布表可知,P{|Z|≤1.96}=0.95,即有: P{|Z|=|
X?1050200|≤1.96}= P{|X-1050|≤392}=0.95
所以95%的灯管的使用寿命在均值左右392小时(658~1442小时)的范围内。
16
第六章 抽样与参数估计
【重点】深刻理解抽样分布的概念及中心极限定理的意义,灵活掌握均值和比例的区间估计方法的应
用。
【难点】在不同条件下的区间估计。 思考题
6.1 什么是抽样误差?影响抽样误差的主要因素有哪些?
6.2 确定必要的抽样数目(样本容量)有何意义?必要抽样数目受哪些因素影响? 6.3 什么叫统计量?什么是参数?评价统计量优劣有哪些标准? 6.4 分层抽样与整群抽样的分组作用及方法各是什么? 6.5 解释抽样推断的含义。
6.6 解释简单随机抽样、分层抽样、系统抽样和整群抽样的含义。 6.7 什么是抽样分布?
6.8 样本统计量的分布与总体分布的关系是什么?
6.9 样本均值抽样分布的两个主要特征值是什么? 它们与总体参数有什么关系? 练习题
一、单项选择题
1、某品牌袋装糖果重量的标准是(500±5)克。为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。下列说法中错误的是( )
A、样本容量为10 B、抽样误差为2 C、样本平均每袋重量是估计量 D、498是估计值
2、设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都服从或近似服从趋近于( )
A、N(100,25) B、N(100,5/
n)
C、N(100/n,25) D、N(100,25/n)
3、在其他条件不变的情况下,要使置信区间的宽度缩小一半,样本量应增加( ) A、一半 B、一倍 C、三倍 D、四倍
4、在其他条件不变时,置信度(1–α)越大,则区间估计的( )
A、误差范围越大 B、精确度越高
C、置信区间越小 D、可靠程度越低
5、其他条件相同时,要使抽样误差减少1/4,样本量必须增加( )
A、1/4 B、4倍 C、7/9 D、3倍 6、在整群抽样中,影响抽样平均误差的一个重要因素是( )
A、总方差 B、群内方差 C、群间方差 D、各群方差平均数
7、在等比例分层抽样中,为了缩小抽样误差,在对总体进行分层时,应使( )尽可能小 A、总体层数 B、层内方差 C、层间方差 D、总体方差
8、一般说来,使样本单位在总体中分布最不均匀的抽样组织方式是( ) A、简单随机抽样 B、分层抽样 C、等距抽样 D、整群抽样
9、为了了解某地区职工的劳动强度和收入状况,并对该地区各行业职工的劳动强度和收入情况进行对比分析,有关部门需要进行一次抽样调查,应该采用( ) A、分层抽样 B、简单随机抽样 C、等距抽样 D、整群抽样
17
10、某企业最近几批产品的优质品率分别为88%,85%,91%,为了对下一批产品的优质品率进行抽样检验,确定必要的抽样数目时,P应选( )
A、85% B、87.7% C、88% D、90% 二、多项选择题
1、影响抽样误差大小的因素有( )
A、总体各单位标志值的差异程度 B、调查人员的素质 C、样本各单位标志值的差异程度 D、抽样组织方式 E、样本容量
2、某批产品共计有4000件,为了了解这批产品的质量,从中随机抽取200件进行质量检验,发现其中有30件不合格。根据抽样结果进行推断,下列说法正确的有( ) A、n=200 B、n=30 C、总体合格率是一个估计量
D、样本合格率是一个统计量 E、合格率的抽样平均误差为2.52%
3、用样本成数来推断总体成数时,至少要满足下列哪些条件才能认为样本成数近似于正态分布( )
A、np≤5 B、np≥5 C、n(1–p)≥5 D、p≥1% E、n≥30
三、填空题
1、对某大学学生进行消费支出调查,采用抽样的方法获取资料。请列出四种常见的抽样方
法: 、 、 、 ,当对全校学生的名单不好获得时,你认为 方法比较合适,理由
是 。 四、简答题
1、分层抽样与整群抽样有何异同?它们分别适合于什么场合? 2、解释抽样推断的含义。 五、计算题
1、某糖果厂用自动包装机装糖,每包重量服从正态分布,某日开工后随机抽查10包的重量如下:494,495,503,506,492,493,498,507,502,490(单位:克)。对该日所生产的糖果,给定置信度为95%,试求:
(1)平均每包重量的置信区间,若总体标准差为5克; (2)平均每包重量的置信区间,若总体标准差未知;
(t0.025,9?2.2622,t0.025,10?2.2281,t0.05,9?1.8331,t0.05,10?1.8125);
2、某广告公司为了估计某地区收看某一新电视节目的居民人数所占比例,要设计一个简单随机样本的抽样方案。该公司希望有90%的信心使所估计的比例只有2个百分点左右的误差。为了节约调查费用,样本将尽可能小,试问样本量应该为多大?
3、为调查某单位每个家庭每天观看电视的平均时间是多长,从该单位随机抽取了16户,得样本均值为6.75小时,样本标准差为2.25小时。
(1)试对家庭每天平均看电视时间进行区间估计。
(2)若已知该市每个家庭看电视时间的标准差为2.5小时,此时若再进行区间估计,并且将边际
误差控制在(1)的水平,问此时需要调查多少户才能满足要求?(α=0.05) 答案:
18
一、B,D,C,A,C;C,B,D,A,A。 二、ADE,ADE,BCE。
三、简单随机抽样,分层抽样,等距抽样,整群抽样,分层抽样,不用调查单位的名单,以院系为单位,而且各院系的消费差异也大,不宜用整群抽样。
四、1、答:都要事先按某一标志对总体进行划分的随机抽样。不同在于:分层抽样的划分标志与调
查标志有关,而整群抽样不是;分层抽样在层内随机抽取一部分,而整群抽样对一部分群做全面调查。分层抽样用于层间差异大而层内差异小,以及为了满足分层次管理决策时;而整群抽样用于群间差异小而群内差异大时,或只有以群体为抽样单位的抽样框时。
2、答:简单说,就是用样本中的信息来推断总体的信息。总体的信息通常无法获得或者没有必
要获得,这时我们就通过抽取总体中的一部分单位进行调查,利用调查的结果来推断总体的数量
特征。
五、1、解:n=10,小样本 (1)方差已知,由x±zα/2
?n得,(494.9,501.1)
(2)方差未知,由x±tα/2
2sn得,(493.63,502.37)
z?p?(1?p)1.6448?0.5?0.5 2、解:n=?/2==1691 220.02?x2 3、解:(1)x±tα/2
sn=6.75±2.131×
2.2516=(5.55,7.95)
(2)边际误差E= tα/2
sn=2.131×
2.2516=1.2
n=
z?/2??E222=
1.962?2.5221.2=17
课后练习题
6.10 设有一个容量为40,样本均值为25,总体标准差为5的随机样本。要求,
(1) 计算抽样平均误差
(2) 在95%的概率下求抽样极限误差 (3) 建立总体均值的90%置信区间。
6.11 记录20次电话预订机票的时间(分钟)如下:
2.1 10.4 4.8 5.5 5.9 10.5 4.5 4.8 3.3 5.8
2.8 6.6 7.5 4.8 5.5 3.5 5.3 3.6 7.8 6.0 (1) 20次电话预订机票平均时间的点估计是多少? (2) 假定总体服从正态分布,求总体平均时间的95%置信区间
19