补充内容 §2 参数的点估计
例2.1 设总体服从泊松分布X~P(?),X1,X2,…,Xn为来自X的样本,求?的矩估计量与?的极大似然估计。
??X或???S2。 解 因E(X)=?,D(X)=?.。所以?的矩估计量为?nx! 设x1,x2,…,xn为样本观察值,则似然函数
x???X~P(?),其分布律为 P(X?x)=e, x=0,1,2,?
L(x1,x2,?xn,?)=
n?i?1n?xie??xi!xe?n???i ?n?xi!i?1nlnL??n???xi?ln???lnxi!
i?1i?1 令 dlnL??n?i?1d???xin1n?,解得?的极大似然估计 ???xi?x。 ?0ni?1???10?x?1,其中 例2.2 设总体X的概率密度函数为f(x,?)???x??0为未知参
其它?0数,X1,X2,…,Xn为来自X的样本,试求?的矩估计与极大似然估计。
解 因为 EX? 令X?EX??????xf(x)dx??x?x??1dx???x?dx?0011?1??
?1??,解得? 的矩估计量为???X。 1?X似然函数L(x1,x2,?xn,?)???xi?1n??1i??(?xi)ni?1n??1,lnL?nln??(??1)?lnxi
i?1nn??? 令dlnL?n??lnxi?0,解得?的极大似然估计 ?d??i?1n?lnxi?1n
i
练习题
2.1 从一批电子元件中抽取8个进行寿命测验,得到如下数据(单位:h):
1050 1100 1130, 1040, 1250, 1300, 1200, 1080
试对这批元件的平均寿命以及寿命分布的标准差给出矩估计.
2.2 设X1,X2,…,Xn是容量为n的样本,试分别求总体未知参数的矩估计量与极大似然估计量。已知总体的分布密度如下:
(1) f(x;?)=(?+1)x?,0 ??x (2) f(x;?)?????0,??1,0?x?1,其中??0为未知参数; 其它 §3 区间估计 例3.1 一车间生产滚珠直径服从正态分布,从某天的产品里随机抽取6个,测得直径为(单位:mm) 14.6,15.1,14.9,14.8,15.2,15.1 若该天产品直径的方差?2=0.06,求该天生产的滚珠平均直径μ的置信区间(?=0.01;?=0.05)。 解 因为?2=0.06,由式(2.2.2)知?的1-?的置信区间为(X??nu?,X?2?nu?)。 2 当?=0.01时,查正态分布表得u?=2.58,计算得x?14.95,将x?14.95, ?2=0.06, 2n=6,u0.005=2.58,代入上述置信区间,得?的99%置信区间为(14.95-2.580.06,14.95+2.580.06)=(14.69, 15.21) 66 当?=0.05时,查正态分布表得u?=1.96,类似求得?的95%的置信区间为(14.75,15.15)。 2例3.2 水体中的污水和工业污染的多少会通过减少水中被溶解的氧气而影响水体的 水质,生物的生长与生存有赖于正中氧气。两个月内,从污水处理厂下游1英里处的一条小河里取得8个水样。检测水样里溶解的氧气含量,数据列表2.2.1。 表2.2.1 水样 氧(ppm) 1 5.1 2 4.9 3 5.6 4 4.2 5 4.8 6 4.5 7 5.3 8 5.2 n 8 根据最近的研究,为了保证鱼的生存,水中溶解的氧气的平均含量需达到百万分之五,即5.0ppm.试求两个月期间平均氧气含量的95%的置信区间(假定样本来自正态总体)。 解 ?2未知,所以由式(2.2.3)知?的1-?置信区间为(X?St?(n?1),X?St?(n?1)),由 n2n2已知n=8,1-?=0.95,查附表2得t0.025(7)=2.3646,由样本计算得x=4.95,S=0.45,故?的 1-?的置信区间为(4.78,5.12)。 例3.3 从自动机床加工的同类零件中随机地抽取10件测得其长度值为(单位:mm) 12.15 , 12.12, 12.10 , 12.28 , 12.09, 12.16 , 12.03 , 12.01 , 12.06 ,12.11 . 假定样本来自正态总体,试求方差?2的95?的置信区间。 2 解 已知 ?=0.05,查附表3得χ2?(n?1)??0, .975(9)?2.71?222, 又由已知数据算得 S=0.076, 于是χ?(n?1)??0.025(9)?19.023222(n?1)S29?0.0762(n?1)S9?0.076, , ??0.003??0.019219.023??(n?1)2.7?2?(n?1)21?222所以,方差?2的95?的置信区间是[(n?1)S,(n?1)S]=[0.003,0.019]。 22???21??2 练习题 2.3 某乡农民在联产承包责任制前,人均纯收入X~N(300,252)(单位:元),推行联产承包责任制后,在该乡抽得n=16的样本得x?325 元,假设?2?252没有变化,试确定μ的95%的置信区间。 2.4 为了估计一分钟一次广告的平均费用,抽取了15个电台作为一个简单随机样本,算得样本均值x?806元,样本标准差S=416。假定一分钟一次的广告费X~N(?,?2),试求?的0.95的置信区间. 2.5 1990年在某市调查14户城镇居民,得平均户人均购买食用植物油为x?8.7kg标准差为S=1.67kg。假设人均食用植物油量X~N?,?2,求 (1)总体均值?的95%的置信区间; (2)总体方差?的90%的置信区间。 2 ??§4 参数假设检验 例4.1 正常人的脉搏平均每分钟72次,某医生测得10例四乙基铅中毒患者的脉搏数 (次/分)如下 54,67,68,78,70,66,67,65,69,70 已知人的脉搏次数服从正态分布,试问四乙基铅中毒患者的脉搏和正常人的脉搏有无显著差异?(?=0.05) 解 以X表示脉搏次数,依题意设X~N(?,?2) (?2未知),要检验假设 H0:?=72, H1:??72。 由式(3.2)知H0的拒绝域为 T0?X??0?t?(n?1) ?n2 由样本算得 x?67.4,S?5.929查表t?(n?1)?t0.025(9)?2.2622 2T0?X??067.4?72??2.453?2.2622 ?n5.92910故拒绝H0,认为乙基铅中毒患者的脉搏和正常人的脉搏有显著差异。 例4.3 某工厂生产的保健饮料中游离氨基酸含量(mg/100ml)在正常情况下服从正态分 布N(200,252)。某生产日抽测了6个样品,得数据如下: 205,170,185,210,230,190 试问这一天生产的产品游离氨基酸含量的总方差是否正常。 2 解 建立原假设H0:?2??0?252 22 由?=0.05,n=6,查附表3得?0,由样本均值算得,?0.025(5)?12.833.975(5)?0.831222x?198,S2?477,所以?2?(n?1)S?5?447?3.576,由于?0.975??0??0.025,故接受H0,即 02?02522这一天生产的产品中游离氨基酸含量的总体方差正常。 类似于均值的检验,方差也有单边检验的问题,见表3.2.1。 例 4.4 一个混杂的小麦品种,株高标准差?0=14(cm),经提纯后随机抽取10株,株高(单位:cm)为:90,105,101,95,100,100,101,105,93,97,考察提纯后的群体是否比原来群体整齐?(?=0.01) 解 已知小麦株高服从正态分布,现在要检验假设 H0:?2?142,H1:?2?142 小麦经提纯后株高只能更整齐,不会变得更离散,即?2不会大于142。 现取?=0.01,检验统计量选为?2?(n?1)S~?2(n?1),由附表3知?12??(n?1)??20.99?9??2.088, 2?2218.122得H0的拒绝域为?0??12??(n?1),由样本算得?0??1.113?2.088在拒绝域内,故拒绝214H0接受H1,即提纯后的株高高度更整齐。 练习题 3.1 某砖厂生产的砖头的抗断强度X(105Pa)服从正态分布,设方差?2=1.21,从产品中随 机地抽取6块,测得抗断强度值为 32.66,29.86,31.74,30.15,32.88,31.05 试检验这批砖头的平均抗断强度是否为32.50?105Pa (?=0.05)? 3.2 某批矿砂的5个样品中的镍含量,经测定为(%):3.25, 3.27, 3.24, 3.26, 3.24, 设测定值总体服从正态分布,但参数均未知。问在?=0.01下能否接受假设:这批矿砂的镍含量的均值为3.25。 3.7 假定考生成绩服从正态分布,在某地一次数学统考中,随机抽取了36位考生的成绩,算得平均成绩为66.5分,标准差为15分,问在显著水平0.05下,是否可以认为这次考试全体考生的平均成绩70分? 3.8考察一鱼塘中的含汞量,随机地取10条鱼测得各条鱼的含汞量(单位:mg)为 0.8 1.6 0.9 0.8 1.2 0.4 0.7 1.0 1.2 1.1 设鱼的含汞量服从正态分布N(?,?2),试检验假设H0:??1.2,H1:??1.2(??0.10). 3.9某电工器材厂生产一种保险丝.测量其熔化时间,依通常情况方差为400,今从某天产 2品中抽取容量为25的样本,测量其熔化时间并计算得x?62.24 s?404.77,问这天保险 丝熔化时间分散度与通常有无显著差异(??0.05,假定熔化时间服从正态分布)? 教材内容 第2章 试验数据的描述性统计分析 例2.1.1 从19个杆塔上的普通盘形绝缘子测得该层电导率(μs)的数据如表2.1.1。 表2.1.1 数据表 8.98 8.00 6.40 6.17 5.39 7.27 9.08 10.40 11.20 8.57 6.45 11.90 10.30 9.58 9.24 7.75 6.20 8.95 8.33 计算该层电导率的x,R,S,S,CV%,并解释所得结果。 均值 8.4295 方差 3.3029 标准差 1.8174 极差 6.51 变异系数 21.5598 偏度 0.11524 峰度 -0.69683 2 补充例题: 某食品厂用自动装罐机生产净重量为345克的午餐肉罐头,由于随机性,每个罐头的净重有差别,现从中随机取10个罐头, 试由这批数据构造经验分布函数并作图。 344,336,345,342,340,338,344, 343, 344,343 解:顺序统计量336,338,340,342,343,344,345 例2.4.1 根据调查,某集团公司的中层管理人员的年薪数据如表2.4.1(单位:千元)。 表2.4.1 数据表 40.6 38.6 38.9 37.1 39.6 39.6 37.9 37.7 37.8 40.0 37.0 39.2 36.2 34.7 35.1 36.9 38.8 41.7 36.7 38.3 根据数据构造茎叶图。 解:先将数字顺序化得表2.4.2。 表2.4.2 34.7 35.1 37 37.1 38.3 38.6 39.6 39.6 则管理人员的年薪的茎叶图见图: 34 7 35 1 36 2 7 37 0 1 38 3 6 39 2 6 40 0 6 41 7 顺序化数据表 36.2 37.7 38.8 40 9 7 8 6 36.9 37.8 38.9 40.6 8 9 36.7 37.9 39.2 41.7 9