本平均数x1,x2,...,xk的标准差,它是x抽样误差的估计值, 其大小说明了样本间变异程度的大小及x精确性的高低。
对于大样本资料,常将样本标准差S与样本平均数x配合使用,记为x±S,用以说明所考察性状或指标的优良性与稳定性。对于小样本资料,常将样本标准误Sx与样本平均数x 配合使用,记为x±Sx,用以表示所考察性状或指标的优良性与抽样误差的大小。
第七节 t 分 布
由样本平均数抽样分布的性质知道: 若x~N(μ, σ), 则x~N(μ, σ/n)。 将随机变量x标准化得:u?(x??)/?x,则u~N(0,1)。 当总体标准差σ未知时, 以样本标准差S代替σ所得到的统计量(x??)/Sx记为t。在计算Sx时,由于采用S来代替σ,使得t 变量不再服从标准正态分布,而是服从t分布(t-distribution)。它的概率分布密度函数如下:
2
2
f(t)??[(df?1)/2]t2?(1?)?(df/2)df?df1df?12 (4-26)
式中,t的取值范围是(-∞,+∞);df=n-1为自由度。
t分布的平均数和标准差为:
μt=0 (df>1), ?t?df/(df?2) (df>2) (4-27)
图4-13 不同自由度的t分布密度曲线 t分布密度曲线如图4-13所示,其特点是:
1、t分布受自由度的制约,每一个自由度都有一条t分布密度曲线。
2、t分布密度曲线以纵轴为对称轴,左右对称,且在t=0时,分布密度函数取得最大值。 3、与标准正态分布曲线相比,t分布曲线顶部略低,两尾部稍高而平。df越小这种趋势越明显。df越大,t分布越趋近于标准正态分布。当n >30时,t分布与标准正态分布的区别很小;n >100时,t分布基本与标准正态分布相同;n→∞时,t 分布与标准正态分布完全一致。
t分布的概率分布函数为:
52
Ft(df)?P(t?t1)????f(t)dt (4-28)
t1因而t在区间(t1,+∞)取值的概率——右尾概率为1-F t (df)。由于t分布左右对称,t在区间(-∞,-t1)取值的概率也为1-F t (df)。于是t分布曲线下由-∞到- t 1和由t 1到+∞两个相等的概率之和——两尾概率为2(1-F t (df))。对于不同自由度下t分布的两尾概率及其对应的临界t值已编制成附表3,即t分布表。该表第一列为自由度df,表头为两尾概率值,表中数字即为临界t值。
例如,当df=15时,查附表3得两尾概率等于0.05的临界t值为t0.05(15) =2.131,其意义是:P(-∞ 由附表3可知,当df一定时,概率P越大,临界t值越小;概率P越小,临界t值越大。 当概率P一定时,随着df的增加,临界t值在减小,当df=∞时,临界t值与标准正态分布的临界u值相等。 习 题 1、什么是随机试验?它具有那三个特征? 2、什么是必然事件、不可能事件、随机事件? 3、概率的统计定义及古典定义分别是什么? 事件的概率具有那些基本性质? 4、什么是小概率事件实际不可能性原理? 5、袋中有10只乒乓球,分别编浩为1到10,从中随机抽取3只记录其编号。 (1) 求最小的号码为5的概率;(1/12) (2) 求最大的号码为5的概率;(1/20) 6、现有6只雏鸡,其中4只是雌的,2只是雄的,从中抽取两次,每次取一只,在返回抽样情况下求: (1)取到的两只雏鸡都是雌性的概率; (2)取到的两只雏鸡性别相同的概率; (3)取到的两只雏鸡至少有一只是雌性的概率; [ (1) 0.444; (2) 0.556; (3) 0.889] 7、假设每个人的血清中含有肝炎病毒的概率为0.4%,混和100个人的血清, 求此血清中含有肝炎病毒的概率。你认为计算结果会告诉我们一个什么事实?(0.33) 8、离散型随机变量概率分布与连续型随机变量概率分布有何区别? 9、什么是正态分布?标准正态分布?正态分布的密度曲线有何特点? 10、已知随机变量u服从N(0,1),求P(u<-1.4), P(u≥1.49), P(|u|≥2.58), P(-1.21≤u<0.45),并作图示意。(0.0792,0.06811,0.00988,0.5605) 11、已知随机变量u服从N(0,1),求下列各式的u?。 (1) P(u<-u?)+P(u≥u?)=0.1;0.52 (2) P(-u?≤u<u?)=0.42;0.95 [(1)1.644854,0.643345;(2)0.553385,1.959964]] 12、猪血红蛋白含量x服从正态分布N(12.86,1.33) (1) 求猪血红蛋白含量x在11.53—14.19范围内的概率。 (2) 若P(x<l1)=0.025,P(x>l2)=0.025,求l1,l2。 2 53 [(1)0.6826,(2)l1=10.25,l2=15.47] 13、设x变量服从正态分布,总体平均数μ=10,P(x≥12)=0.1056,试求x在区间6—16内取值的概率。(0.914948) 14、什么是二项分布?如何计算二项分布的平均数、方差和标准差? 15、已知随机变量x服从二项分布B(100,0.1),求μ及σ。(10,3) 16、记录表明,10头家畜已有3头死于某种疾病,现有5头病畜,试求以下情况的概率: ⑴ 恰有3头死亡; (1323/10000) ⑵ 前面3头死亡,后2头康复; (1323/100000) ⑶ 前面3头死亡; (27/1000) ⑷ 死亡3头以上。 (1539/50000) 17、已知随机变量x服从二项分布B(10,0.6),求P(2≤x≤6),P(x≥7),P(x<3)。 (0.61605,0.38228,0.01229) 18、什么是波松分布?其平均数、方差有何特征? 19、已知随机变量x服从波松分布P(4),求P(x=1),P(x=2),P(x≥4)。 (0.0733,0.1465,0.5665) 20、某种疾病的死亡率为0.005。试问在患有此病的360个病例中,(a)有3例或3例以上死亡的概率;(b)恰有3例死亡的概率。 (0.269,0.160) 21、验收某大批货物时,规定在到货的1000件样品中次品不多于10件时方能接受。如果说整批货物的次品率为0.5%,试求拒收这批货物的概率。(0.014) 22、什么是标准误?标准误与标准差有何联系与区别? 23、样本平均数抽样总体与原始总体的两个参数间有何联系? 24、t分布与标准正态分布有何区别与联系? 54