*2、简述单相关和偏相关的区别,并举例加以说明。
答:偏相关系数和单相关系数虽然都是线性相关系数,但是得出这些系数的前提条件迥然不同,例如,研究Y和X1的线性相关,偏相关系数乃是将X2对Y以及X2通过X1对Y的线性影响统统消去之后的
Y和X1的线性相关系数;而单相关系数乃是将X2对Y以及X2通过X1对Y的线性影响都统统地包括
在内的Y和X1的线性相关系数。因此,除非r偏相关系数r1Y?2决不会和单相关系数r1Y12?0和r2Y?0,相同,而单相关系数r1Y总是或多或少地包含着虚假的成分。
六、计算
1、为了研究粒肥的增重效果,随机取5个样点喷施粒肥,得喷施后各样点小麦千粒重(克)为:47,47,50,49,49;另随机取同样条件下种植但未喷施粒肥的4个样点,得各样点小麦千粒重为:35,40,38,39。试测验喷施粒肥是否可以显著提高产量。(8分) 设:H0:?1??2,HA:?1??2,?????????????????.1分 取显著水平??0.05,v?7时,t0.1,7?1.895???????????.??.1分
y1?48.4,y2?38?????????????????????..???.1分 SS1?7.2,SS2?14 ????????????????????..???.1分 s2?SS1?SS27.2?14??3.029 ???.?????????.??.1分
?n1?1???n2?1?4?3?11??11?sy1?y2?s2????3.029????1.167?.????????.??.1分
?54??n1n2?t?y1?y210.4??8.91??????????..?????????.??.1分 sy1?y21.167t?t0.1,7,所以否定H0,接受HA,即喷施粒肥可以显著提高产量。????1分
2、有一品种(分A1和A2两个水平)和施肥量(分B1和B2两个水平)的二因素试验,重复2次。 (1)试按随机区组设计画出田间设计图。(2分)
21
(2)已知SST=194,SSR=20,SSt=168,SSA=128,SSB=32,试作方差分析,并解释所得结果。
(5分)
(3)已知四个处理A1B1、A1B2、A2B1和A2B2的平均数依次为30、28、24、18,试用PLSD法对不同处理平均数进行多重比较。(5分) (1)田间试验设计排布图图: A2B1 A2B2 A2B2 A1B2 A1B2 A1B1 A1B1 A2B1 ??. ????????2分 (2)SSe?SST?SSt?SSR?194?20?168?6
SSAB?SSt?SSA?SSB?168?128?32?8
方差分析表
变异来源 区组间 处理间
A因素 B因素 A×B 误差 总
df
1 3 1 1 1 3 7
SS
20 168 128 32 8 6 194
MS
20 56 128 32 8 2
F
10* 28** 64* 16 4
???????????.5分 (3)sy1?y2?2?MSe2?2??1.414 n2v?3时,t0.05,3?3.182,t0.01,3?5.841
PLSD0.05?sy1?y2?t0.05?1.414?3.182?4.499 PLSD0.01?sy1?y2?t0.01?1.414?5.841?8.259
处理
平均数 30 28 24 18
22
5% a ab b c
1% A A AB B
A1B1 A1B2 A2B1 A2B2
???????????.5分 3、研究温度(X, ?C)与某一昆虫幼虫生长速率(Y)的关系,得有关统计数分别为:
??a?bX。 (2)Q和n=10,x=5,y=110,SSX=147,SSY=34500,SP=-2070。试求:(1)Y2r2。(5)测验该线性方程的显著性。U。 (3)sY(10分) /X。 (4)r和
(1)b?SP?2070???14.08;a?y?b?x?110?14.08?5?180.4 SSX147??180.4?14.08X???????????????.. .2分 则线性回归方程为:YSP2??2070?SP2??29148.98; Q?SSY?(2)U??5351.02?.... .2分 SSX147SSX(3)sY/X?(4)r?(5)
变异来源 线性回归 离回归 总变异
或:sb?sY/X/SSX?22Q5351.02??668.88????????????????..2分 n?28SP?2070???0.919; r2?0.845?????. .2分
SSX?SSY147?34500df
1
8 9
SS
29148.98 5351.02
MS
29148.98 668.88
F
43.58
**
668.88b?14.08??6.60 ?2.13; t??sb2.13147t?t0.01,8?3.355,所以达到极显著水平。???????????????2分
附注:
u分布的累积函数F(?2.32)?0.01;
t0.05,3?3.182,t0.01,3?5.841;t0.1,7?1.895,t0.05,7?2.365,t0.01,7?3.499,t0.05,8?2.306,t0.01,8?3.355;F0.05,1,8?5.32,F0.01,1,8?11.26,F0.05,3,3?9.28, F0.01,3,3?29.46,F0.05,1,3?10.13,F0.01,1,3?34.12( 2005-2006学年第1学期)
一、名词解释(2×10)
1、标准差:变数变异程度的度量,对于总体????Y???i2,对于样本
N23
(Y?y)2。 ?s?n?12、样本:从总体中抽出的一个部分。
3、置信区间:若使参数?在?L1,L2?中的概率为1??,即:
P?L1???L2??1??,则区间?L1,L2?叫做参数?的1??的置信区间。
4、唯一差异原则:除了处理因素具有的不同水平外,其余的各种环境因素均应保持在特定的水平上。 5、回归截距:线性回归中直线在Y轴上的截距,a?y?bx。 6、单尾测验:否定区位于分布的一尾的测验。 7、接受区:接受无效假设H0的区间。 8、无偏估值:在统计上,若所有可能样本的某一统计数的平均数等于总体的相应参数,则称该统计数
为总体相应参数的无偏估值。
9、相关系数:反映变数间相关密切程度及其性质的统计数,r?SP。 SSX?SSY*10、偏回归系数:在其它自变数皆保持在一定数量水平时,任一自变数对依变数的效应。 二、是非题,请在下列正确的题目后面打“√”,错误的打“×”。(1×10)
13、 描述总体的特征数叫统计数。( × ) 若否定无效假设
( × ) H0则必犯?错误。
( × ) u分布的累积频率分布图是左右对称的。
14、 调和平均数是变量对数的算术平均数的反对数。( × )
5、一个显著的相关或回归并不一定具有实践上的预测意义。( √ )6、随机区组试验只应用了随机和局部控制两个原则。( × ) 7、关于方差的假设测验均可以用F测验。( × )8、成对比较分析时不需要考虑两者的总体方差是否相等。( √ ) 9、连续性校正常数为0.05。( × )10、对立事件是指两个不可能同时发生但必发生其一的事件。( √)
三、单项选择题(2×10)
1、单个方差的假设测验用[ C ]测验。
A、u B、? C、u或? D、F 2、算术平均数的重要特性之一是离均差平方和[ A ]。
A、最小 B、最大 C、等于零 D、接近零
3、某一变数Y服从正态分布N?10,10?,当以n?10进行随机抽样时,样本平均数大于12的概率为[ B ]。
A、0.005 B、0.025 C、0.05 D、0.01
2224
4、在一元线性回归分析中, ??)=[ A ]。 (Xx)(Y-YA、0 B、SP C、U D、Q
5、当一个因素的简单效应随着另一因素水平的增加而增加时有[ A ]。
A、正互作 B、负互作 C、零互作 D、互作效应 6、Fisher氏保护最小显著差数测验法又称为[ A ]。
A、PLSD法 B、SSR法 C、q法 D、DLSD法 7、单个样本方差与某一指定值之间的差异显著性测验一般用[ D ]测验。
A、?2 B、F C、u D、?2 或u 8、测验线性回归的显著性时,t?(b??)/sb遵循[ B ]的学生氏分布。
A、?=n-1 B、?=n-2 C、?=n-m-1 D、?=n
9、对一批棉花种子做发芽试验,抽样1000粒,得发芽种子850粒,若规定发芽率达90%为合格,测验这批种子是否合格的显著性为[ C ]。 A、不显著 B、显著 C 、极显著 D、不好确定 *10、拉丁方试验设计的特点不包括[ D ]。
A、处理数必须等于重复数 B、误差项自由度小 C、适用于多因素试验 D、能较大程度地减少误差 四、填空(1×10)
1、已知Y~N(m,s2),则Y在区间[m-1.96s,m+1.96s]的概率为 0.95 。 2、田间试验设计的三大原则为 重复 、 随机化 和 局部控制 。
3、以7月10日为0,某昆虫日发生量遵循N(10, 36),则该螟蛾发生的始盛日期为 7月14日 ,盛末日期为 7月26日 。 4、水稻亚优二号的单株产量(克)为一正态分布,其总体方差为36,若以n=9抽样,要在a=0.05水平上否定H0:??100和H0:??100,则其接受区分别为 [96.08,103.92] 和?96.71。 5、根据遗传学原理,豌豆的红花纯合基因型和白花纯合基因型杂交后,在F2代白花植株出现的概率为0.25。若一次试验中观测2株F2植株,则至少有一株为白花的概率为 0.4375 ;若希望有99%的把握获得1株和1株以上的白花植株,则F2需种植 16 株。 五、简答(5×2)
1、根据所学内容简述统计方法的主要功用。
答:⑴提供了整理和描述数据的科学的方法;⑵提供了由样本推论总体的科学的方法;⑶提供了通过误差分析鉴定处理效应的科学的方法;⑷提供了进行科学试验设计的一些重要的原则;⑸提供了分析多个变数间相关密切程度的科学的方法。 *2、结合单因素和多因素试验的不同,试区分处理和水平这两个概念。 答:水平:某一因素不同的质量或数量等级;处理:各因素水平与水平的组合。
单因素试验中只有一个试验因素,所有处理都仅是这一个因素的不同数量或质量水平;多因素试验是考察反应量在各因素不同水平和不同水平组合上的变化规律,找出水平的最佳组合(固定模型)或估计总体变异度(随机模型),处理是各因素的不同水平与水平的组合。
25