(3)由于p=0.0005,假如n=5000,则np=2.5<5,二项分布呈明显的偏态,用正态分布来计算就会出现非常大的误差。此时宜用泊松分布去近似。
3.11(1)
合格率为1-0.04779=0.95221或95.221%。
=0.04779
(2) 设所求值为K,满足电池寿命在200±K小时范围内的概率不小于0.9,即有:
即:
3.12设X =同一时刻需用咨询服务的商品种数,由题意有X~B(6,0.2)
(1)X的最可能值为:X0=[(n+1)p]=[7×0.2]=1 (取整数)
,K/30≥1.64485,故K≥49.3456。
(2)
=1-0.9011=0.0989
第4章 抽样与抽样分布
练习:
4.1 一个具有个观察值的随机样本抽自于均值等于20、标准差等于16的总体。
⑴ 给出的抽样分布(重复抽样)的均值和标准差
⑵ 描述的抽样分布的形状。你的回答依赖于样本容量吗?
⑶ 计算标准正态统计量对应于⑷ 计算标准正态统计量对应于4.2 参考练习4.1求概率。
⑴<16; ⑵>23; ⑶>25; ⑷.4.3 一个具有的近似值:
的值。 的值。
落在16和22之间; ⑸
、
<14。
个观察值的随机样本选自于的总体。试求下列概率
4.4 一个具有个观察值的随机样本选自于和的总体。
⑴ 你预计的最大值和最小值是什么? ⑵ 你认为至多偏离多么远?
⑶ 为了回答b你必须要知道吗?请解释。
4.5 考虑一个包含的值等于0,1,2,…,97,98,99的总体。假设的取值的可能性是
相同的。则运用计算机对下面的每一个值产生500个随机样本,并对于每一个样本计
算。对于每一个样本容量,构造的500个值的相对频率直方图。当值增加时在
和
直方图上会发生什么变化?存在什么相似性?这里
。
4.6 美国汽车联合会(AAA)是一个拥有90个俱乐部的非营利联盟,它对其成员提供旅行、
金融、保险以及与汽车相关的各项服务。1999年5月,AAA通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元(《旅行新闻》Travel News,1999年5月11日)。假设这个花费的标准差是15美元,并且AAA所报道的平均每日消费是总体均值。又假设选取49个4口之家,并对其在1999年6月期间的旅行费用进行记录。
⑴ 描述(样本家庭平均每日餐饮和住宿的消费)的抽样分布。特别说明服从怎样
的分布以及的均值和方差是什么?证明你的回答;
⑵ 对于样本家庭来说平均每日消费大于213美元的概率是什么?大于217美元的概率
呢?在209美元和217美元之间的概率呢? 4.7 技术人员对奶粉装袋过程进行了质量检验。每袋的平均重量标准为
克、标准
差为克。监控这一过程的技术人者每天随机地抽取36袋,并对每袋重量进行测量。现考虑这36袋奶粉所组成样本的平均重量。 (1)描述
的抽样分布,并给出
和
的值,以及概率分布的形状;
,这是否意味着装袋过程出现问题了呢,
种不同的股票。每一种
(3) 假设某一天技术人员观察到
为什么? 股票月收益率的均值为
,标准差
4.8 在本章的统计实践中,某投资者考虑将1000美元投资于
。对于这五种股票的投资组合,投
资者每月的收益率是。投资者的每月收益率的方差是,它是投资者所面临风险的一个度量。
⑴ 假如投资者将1000美元仅投资于这5种股票的其中3种,则这个投资者所面对的风
险将会增加还是减少?请解释;
⑵ 假设将1000美元投资在另外10种收益率与上述的完全一样的股票,试度量其风险,
并与只投资5种股票的情形进行比较。
4.9 某制造商为击剑运动员生产安全夹克,这些夹克是以剑锋刺入其中时所需的最小力量
(以牛顿为单位)来定级的。如果生产工艺操作正确,则他生产的夹克级别应平均840牛顿,标准差15牛顿。国际击剑管理组织(FIE)希望这些夹克的最低级别不小于800牛顿。为了检查其生产过程是否正常,某检验人员从生产过程中抽取了50个夹克作为一个随机样本进行定级,并计算,即该样本中夹克级别的均值。她假设这个过程的标准差是固定的,但是担心级别均值可能已经发生变化。 ⑴ 如果该生产过程仍旧正常,则的样本分布为何?
⑵ 假设这个检验人员所抽取样本的级别均值为830牛顿,则如果生产过程正常的话,
样本均值≤830牛顿的概率是多少?
⑶ 在检验人员假定生产过程的标准差固定不变时,你对b部分有关当前生产过程的现
状有何看法(即夹克级别均值是否仍为840牛顿)?
⑷ 现在假设该生产过程的均值没有变化,但是过程的标准差从15牛顿增加到了45牛
顿。在这种情况下的抽样分布是什么?当具有这种分布时,则≤830牛顿的概率是多少?
4.10 在任何生产过程中,产品质量的波动都是不可避免的。产品质量的变化可被分成两类:
由于特殊原因所引起的变化(例如,某一特定的机器),以及由于共同的原因所引起的变化(例如,产品的设计很差)。
一个去除了质量变化的所有特殊原因的生产过程被称为是稳定的或者是在统计控制中的。剩余的变化只是简单的随机变化。假如随机变化太大,则管理部门不能接受,但只要消除变化的共同原因,便可减少变化(Deming,1982,1986;De Vor, Chang,和Sutherland,1992)。
通常的做法是将产品质量的特征绘制到控制图上,然后观察这些数值随时间如何变
动。例如,为了控制肥皂中碱的数量,可以每小时从生产线中随机地抽选块试验肥皂作为样本,并测量其碱的数量,不同时间的样本含碱量的均值描绘在下图中。假设这个过程是在统计控制中的,则的标准差除以样本容量的平方根,
的分布将具有过程的均值
,标准差具有过程
。下面的控制图中水平线表示过程均值,
两条线称为控制极限度,位于的上下3的位置。假如落在界限的外面,则有充分的理由说明目前存在变化的特殊原因,这个过程一定是失控的。 当生产过程是在统计控制中时,肥皂试验样本中碱的百分比将服从
的近似的正态分布。
和
⑴ 假设则上下控制极限应距离多么远?
⑵ 假如这个过程是在控制中,则落在控制极限之外的概率是多少? ⑶ 假设抽取样本之前,过程均值移动到
确的)结论的概率是多少?
,则由样本得出这个过程失控的(正
4.11 参考练习4.10。肥皂公司决定设置比练习4.10中所述的这一限度更为严格的控制
极限。特别地,当加工过程在控制中时,公司愿意接受落在控制极限外面的概率是0.10。
⑴ 若公司仍想将控制极限度设在与均值的上下距离相等之处,并且仍计划在每小时的
样本中使用个观察值,则控制极限应该设定在哪里? ⑵ 假设a部分中的控制极限已付诸实施,但是公司不知道,现在是3%(而不是2%)。若,则落在控制极限外面的概率是多少?若呢?
4.12 参考练习4.11。为了改进控制图的敏感性,有时将警戒线与控制极限一起画在图上。
警戒限一般被设定为。假如有两个连续的数据点落在警戒限之外,则这个过程一定是失控的(蒙哥马利,1991年)。 ⑴ 假设肥皂加工过程是在控制中(即,它遵循
的下一个值落在警戒限之外的概率是什么?
和
的正态分布),则
⑵ 假设肥皂加工过程是在控制中,则你预料到画在控制图上的的这40个值中有多
少个点落在上控制极限以上?
⑶ 假设肥皂加工过程是在控制中,则的两个未来数值落在下警戒线以下的概率是多
少? 答案
4.1 ⑴ 20, 2; ⑵ 近似正态; ⑶ -2.25; ⑷ 1.50。
4.2 ⑴ 0.0228; ⑵ 0.0668; ⑶ 0.0062; ⑷ 0.8185; ⑸ 0.0013。 4.3 ⑴ 0.8944; ⑵ 0.0228; ⑶ 0.1292; ⑷ 0.9699。 4.4 ⑴ 101, 99 ⑵ 1 ; ⑶ 不必。 4.5 趋向正态。
4.6 ⑴ 正态分布, 213, 4.5918; ⑵ 0.5, 0.031, 0.938。
4.7 ⑴ 406, 1.68, 正态分布; ⑵ 0.001; ⑶是,因为小概率出现了。
4.8 ⑴ 增加; ⑵ 减少。
4.9 ⑴ 正态; ⑵ 约等于0; ⑶ 不正常; ⑷ 正态, 0.06。 4.10 ⑴ 0.015; ⑵ 0.0026; ⑶ 0.1587。 4.11 ⑴ (0.012, 0.028); ⑵ 0.6553, 0.7278。 4.12 ⑴ 0.05; ⑵ 1 ; ⑶ 0.000625。 答案
5.1 (1)
;(2)E=1.55。
5.2 (1);(2)E=4.2;(3)(115.8,124.2)。 5.3 (2.88,3.76);(2.80,3.84);(2.63,4.01)。 5.4 (7.1,12.9)。 5.5 (7.18,11.57)。
5.6 (18.11%,27.89%);(17.17%,22.835)。 5.7 (1)(51.37%,76.63%);(2)36。 5.8 (1.86,17.74);(0.19,19.41)。
5.9 (1)2±1.176;(2)2±3.986;(3)2±3.986;(4)2±3.587;(5)2±3.364。 5.10 (1),;(2)1.75±4.27。 5.11 (1)10%±6.98%;(2)10%±8.32%。 5.12 (4.06,14.35)。 5.13 48。 5.14 139。 5.15 57。 5.16 769。
答案
6.1 研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前提高了”,
所以原假设与备择假设应为:
=“某一品种的小鸡因为同类相残而导致的死亡率”,
,。
6.4 (1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60克,但
检验结果却提供证据支持店方倾向于认为其重量少于60克;
(2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验结果却没有提供足够的证据支持店方发现这一点,从而拒收这批产品; (3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。
6.3
6.2
6.5 (1)检验统计量
(2)如果
,在大样本情形下近似服从标准正态分布;
,就拒绝
;
。
(3)检验统计量=2.94>1.645,所以应该拒绝
6.6 6.7 6.8 6.9 6.10 6.11 6.12 6.13
=3.11,拒绝=1.93,不拒绝=7.48,拒绝
。 。 。
。 。 。 。
=206.22,拒绝=-5.145,拒绝=1.36,不拒绝=-4.05,拒绝
=8.28,拒绝。 6.14 (1)检验结果如下: t-检验: 双样本等方差假设
平均 方差 观测值 合并方差 假设平均差
df t Stat P(T≤t) 单尾 t 单尾临界 P(T≤t) 双尾
变量 1 100.7 24.11578947
20 28.73684211
0 38 -5.427106029 1.73712E-06 1.685953066 3.47424E-06
变量 2 109.9 33.35789474
20