第一章
第一章 概论
解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互
作、随机误差、系统误差、准确性、精确性。
习题1.1
答:生物统计学是用数理统计的原理和方法来分析和解释生物界各种现象和实验调查资料,是研究生命过程中以样本来推断总体的一门科学。 生物统计学的主要内容包括实验设计和统计分析。基本作用有以下四个方面:①提供整理和描述数据资料的科学方法,确定某些数性状和特性的数理特征;②判断实验结果的可靠性;③提供有样本推断总体的方法;③提供实验设计的一些重要原则。
习题1.2
总体:总体是具有相同性质的个体所组成的集合,是研究对象的全体。 样本:是从总体中抽出来的若干个体所组成的集合。 样本容量:样本中所含个体总数。
变量:相同性质的事物间表现的差异性的某些特征。 参数:是描述总体特征的数量。 统计数:是描述样本特征的数量。
效应:是由因素而引起的实验差异的作用。
互作:是指两个或两个处理因素间的相互作用产生的效应。
实验误差:实验中不可控因素所引起的观测值和真实值之间的差异。
习题1.3
答:随机误差:它是由实验中许多无法控制的因素所造成的实验结果和真实值之间的误差,是不可避免的。
系统误差:是由于实验处理以外的其他条件明显不一致所造成的带有倾向性的或定向的偏差,是可控的。
习题1.4
答:准确性指在调查和实验中某一实验指标或性状的观测值和真实值接近程度。精确性指调查和实验中同一实验指标或性状的重复观察值彼此接近的程度。
准确性是说明测定值和真实值之间符合程度的大小;精确性是反映多次测定值的变异程度。
第二章
第二章 试验资料的整理与特征数的计算习题
习题2.3
答:平均数的用处:①平均数指出了一组数据的中心位置,标志着资料所代表性状的数量水平和质量水平; ②作为样本或资料的代表数据与其他资料进行比较。 平均数的特征:①离均差之和为零; ②离均差平方和为最小。
标准差的用处: ①标准差的大小,受实验后调查资料中的多个观测值的影响,如果观测值之间的差异大,离均差就越大; ②在计算标准差是如果对观察值加上一个或减去一个a,标准差不变;如果给各观测值乘以或除以一个常数a,所得的标准差就扩大或缩小a倍; ③在正态分布中,X+-S内的观测值个数占总个数的68.26%,X-+2s内的观测值个数占总个数的95.49%,x-+3s 内的观测值个数占总个数的99.73%。
标准差的特征: ①表示变量分布的离散程度; ②标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例; ③估计平均数的标准差; ④进行平均数区间估计和变异数的计算。
习题2.4
答:总体平均数μ=∑x/N,式中分母为总体观察个数N; 样本平均数x=∑x/n,公式中n是样本容量; 样本平均数是总体平均数的无偏估计值。
总体和样本标准差都等于离均差的平方和除以样本容量; 而总体标准差σ= ,分母上是总体观测值个数N; 而样本标准差是s= ,分母上是样本自由度n-1. 样本标准差s是总体标准差σ的无偏估计值。
2.1 某地 100 例 30 ~ 40 岁健康男子血清总胆固醇 (mol 2 L -1 ) 测定结果如下:?
4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.85 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 计算平均数、标准差和变异系数。
【答案】 =4.7398, s=0.866, CV =18.27 %?
2.2 试计算下列两个玉米品种 10 个果穗长度 (cm) 的标准差和变异系数,并解释所得结果。
24 号: 19 , 21 , 20 , 20 , 18 , 19 , 22 , 21 , 21 , 19 ;? 金皇后: 16 , 21 , 24 , 15 , 26 , 18 , 20 , 19 , 22 , 19 。 【答案】 1 =20, s 1 =1.247, CV 1 =6.235% ;? 2 =20, s 2 =3.400, CV 2 =17.0% 。??
2.3 某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取 50 绳测其毛重 (kg) ,结果分别如下:?
单养 50 绳重量数据: 45 , 45 , 33 , 53 , 36 , 45 , 42 , 43 , 29 , 25 , 47 , 50 , 43 , 49 , 36 , 30 , 39 , 44 , 35 , 38 , 46 , 51 , 42 , 38 , 51 , 45 , 41 , 51 , 50 , 47 , 44 , 43 , 46 , 55 , 42 , 27 , 42 , 35 , 46 , 53 , 32 , 41 , 48 , 50 , 51 , 46 , 41 , 34 , 44 , 46 ;?
混养 50 绳重量数据: 51 , 48 , 58 , 42 , 55 , 48 , 48 , 54 , 39 , 58 , 50 , 54 , 53 , 44 , 45 , 50 , 51 , 57 , 43 , 67 , 48 , 44 , 58 , 57 , 46 , 57 , 50 , 48 , 41 , 62 , 51 , 58 , 48 , 53 , 47 , 57 , 51 , 53 , 48 , 64 , 52 , 59 , 55 , 57 , 48 , 69 , 52 , 54 , 53 , 50 。?
试从平均数、极差、标准差、变异系数几个指标来评估单养与混养的效果,并给出分析结论。
【答案】? 1 =42 . 7, R=30, s 1 =7 . 078, CV 1 =16 . 58% ;? 2 =52.1,R=30 ,
s 2 =6.335, CV 2 =12.16% 。
第三章
第三章 概率与概率分布
习题3.1
答:在一定条件下必然出现的时间叫必然事件;相反,在一定条件下必然不出现的事件叫不
可能事件;而在某些确定条件下可能出现,也可能不出现的事件,叫随机事件。例如,发育正常的鸡蛋,在39°C下21天会孵出小鸡,这是必然事件;太阳从西边出来,这是不可能事件;给病人做血样化验,结果可能为阳性,也可能为阴性,这是随机事件。
习题3.2
答:事件A和事件B不能同时发生,即A2B=V,那么称事件A和事件B为互斥事件,如人的ABO血型中,某个人血型可能是A型、B型、O型、AB型4中血型之一,但不可能既是A型又是B型。事件A和事件B必有一个发生,但二者不能同时发生即A+B=U,A3B=V,则称事件A与事件B为对立事件,如抛硬币时向上的一面不是正面就是反面。事件A与事件B的发生毫无关系。反之事件B的发生与事件A的发生毫无关系,则称事件A与事件B为独立事件,如第二胎生男生女与第一台生男生女毫无关系。
习题3.3
答:事件A在n次重复试验中发生了m次,则比值m/n称为事件A发生的频率,记为W(A);事件A在n次重复试验中发生了m次,当试验次数n不断增加时,事件A发生的频率W(A)就越来越接近某一确定值p,则p即为事件A发生的概率。二者的关系是:当试验次数n充分大时,频率转化为概率 。
习题3.4 答:正态分布是一种连续型随机变量的概率分布,它的分布特征是大多数变量围绕在平均数左右,由平均数到分布的两侧,变量数减小,即中间多,两头少,两侧对称。 U=0,σ2=1的正态分布为标准正态分布。
正态分布具有以下特点:标准正态分布具有以下特点:①、正态分布曲线是以平均数μ为峰
1值的曲线,当x=μ时,f(x)取最大值?x?u2?;②、正态分布是以μ为中心向左右两侧对称的
分布 ③、?的绝对值越大,f(x)值就越小,但f(x)永远不会等于0,所以正态分布以x
轴为渐近线,x的取值区间为(-∞,+∞); ④、正态分布曲线完全由参数μ和?来决定 ⑤、正态分布曲线在x=μ±?处各有一个拐点;⑥、正态分布曲线与x轴所围成的面积必定等于1。
正态分布具有两个参数μ和?,μ决定正态分布曲线在x轴上的中心位置,μ减小曲线左移,增大则曲线右移;?决定正态分布曲线的展开程度,?越小曲线展开程度越小,曲线越陡,?越大曲线展开程度越大,曲线越矮宽。
习题3.7
解:(1)F1代非糯杂合体Ww与糯稻亲本ww回交,后代非糯杂合体Ww与糯稻纯合体ww各占一半,即概率均为0.5,故在后代N=200株中预期糯稻和非糯稻均为0.53200=100(株)。
(2)F1代非糯杂合体Ww自交,后代非糯杂合体WW:非糯杂合体Ww:糯稻杂合体ww=1:2:1,但表型非糯:糯稻=3:1,即非糯和糯稻的概率分别为0.75和0.25,故在后代N=2000株中,糯稻应为0.2532000=500(株),非糯稻应为0.7532000=1500(株)。
习题3.8
解: 根据研究的目的基因,可将F2代分为纯合正常抗绣植株和非纯合正常抗绣植株,且不同大麦出现该目的基因为独立的,同时出现纯合正常抗绣植株的概率p=0.0036,非常小,故该题可用二项分布或泊松分布的概率函数公式计算。
(1)?= np=200*0.0036=0.72,代入泊松分布概率函数公式:
eP(X)=
?0.72*0.72x!xX=0,1,2?200
F2代出现纯合正常抗锈植株的各种可能株数的概率分别为: P(0)=0.487 P(1)=0.350 P(2)=0.126 P(3)=0.030 P(4)=0.005 P(5)=0.001
P(X≥6)=1- P(0)- P(1)- P(2)- P(3)- P(4)-P(5) =1-0.487-0.350-0.126-0.030-0.005-0.001=0.001
出现6或6株以上纯合正常抗锈植株的概率总共为0.001,已经非常小了,不必再一一计算。 (2)欲求P(X≥1)=0.99.则P(0)=0.01,即
e?P(X)=
??00!=0.01,
对两边求对数,则有: n =4.605/0.0036=1279株
因此,希望有0.99的概率保证获得1株或1株以上纯合正常抗锈植株,则F2代至少应种1279株。
习题3.9
解:小白鼠接种病菌后,要么生存要么死亡,个体间又相互独立,故服从二项分布。设时间A为接种病菌后生存,由已知得ρ=0.425,n=5,x=4,则“四生一死”的概率为: Ρ(4)=
CP5445?4=530.4253(1-0.425)1=0.0938
4(1)P (0.3 < u ≤ 1.8) ;? (2)P (-1 < u ≤ 1) ;? (3)P (-2 < u ≤ 2) ;? (4)P(-1.96 < u ≤ 1.96 ;? (5)P(-2.58 < u ≤ 2.58) 。?
【答案】 (1)0.34617 ; (2)0.6826 ; (3)0.9545 ; (4)0.95 ; (5)0.9901 。?
3.4 设 x 服从正态分布 N(4 , 16) ,试通过标准化变换后查表计算下列各题的概率值: