第十二章 线性回归分析
练习题
一、最佳选择题
1.SY,X表示( )。
?对Y的离散程度 C.Y和X的离散程度 A.Y的离散程度 B.Y?的离散程度 E.X的离散程度 D.Y对Y2. 用最小二乘法确定直线回归方程的原则是各观察点距直线的( )。
A. 纵向距离之和最小 B.纵向距离的平方和最小 C.垂直距离之和最小 D.垂直距离的平方和最小确 E.纵向距离的平方和最大
3. Y=14+4X 是1-7岁儿童以年龄(岁)估计体重(市斤)的回归方程,若体重 换成国际单位kg,则此方程(? )。
A. 截距改变 B. 回归系数改变 C. 两者都改变 D.两者都不改变 E.相关系数改变
4.直线回归系数假设检验,其自由度为( )。
A. n B. n-1 C. n-2 D. 2n-1 E. 2(n-1)
? 5. 当r=0时,Y=a+bX 回归方程中( )。
A.a必大于零 B.a必等于X C.a必等于零 D.a必等于Y E.a必等于b
6.在多元线性回归分析中,应变量总离均差平方和可以分解为回归平方和与残差平方和 两部分,试回答残差系指 ( )。
?之差 A.观察值Yi与估计值Yi B.观察值Yi与平均值Y之差
?与平均值Y的平方和之差 C.估计值YiD.观察值Yi与平均值Y之差的平方和
?之差的平方和 E.观察值Yi与估计值Yi
二 、问答题
1.用什么方法考察回归直线是否正确?
2.简述回归系数方差分析Y的平方和自由度的分解。
3.简述回归分析中Y的标准差SY与剩余标准差SY,X的区别和联系。
4. 简述SY?与SY的区别。
05.举例说明如何用直线回归方程进行预测和控制? 6.直线回归分析时怎样确定自变量和因变量? 7.简述曲线回归常用的几种曲线形式。 三、计算题
1.一个产科医师发现孕妇尿中雌三醇含量与产儿体重有关,并且两者之间成正相关。现收集了31例待产妇24小时的尿,测量其中的雌三醇含量,同时记录产儿的体重。结果如下表,求直线回归方程并对回归系数作假设检验。
待产妇尿中雌三醇含量与新生儿体重关系
编号 尿雌三醇 新生儿体重 编号 尿雌三醇 新生儿体重 (mg/24h) (kg ) (mg/24h) (kg) (1) (2) (3) (4) (2) (3) 1 7 2.5 17 17 3.2 2 9 2.5 18 25 3.2 3 9 2.5 19 27 3.4 4 12 2.7 20 15 3.4 5 14 2.7 21 15 3.4 6 16 2.7 22 15 3.5 7 16 2.4 23 16 3.5 8 14 3.0 24 19 3.4 9 16 3.0 25 18 3.5 10 16 3.1 26 17 3.6 11 17 3.0 27 18 3.7 12 19 3.1 28 20 3.8 13 21 3.0 29 22 4.0 14 24 2.8 30 25 3.9 15 15 3.2 31 24 4.3 16 16 3.2
2.为探讨某地饮水中氟含量与氟骨症的关系,试对测量得到的下列8对数据进行直线相 关分析 。
氟含量(mg/L)X: 0.47 0.64 1.00 1.47 1.60 2.86 3.21 4.71
患 病 率(%)Y: 22.37 23.31 25.32 22.29 28.57 35.00 46.07 46.08
(1)按此资料绘制散点图?
(2)求直线回归方程并对回归系数作假设检验。
(3)试估计氟含量为2.00 mg/L时,患病率平均增加多少,计算其95%的可信区间,并 说明其含义。
(4)求氟含量为2.00 mg/L时,患病率Y值的95%的容许范围,并解释其含义。
练习题参考答案
一、最佳选择题:
1.D 2.B 3.C 4.C 5.D 6.A
二 、问答题
1.答:用以下三种方法判定: (1)直线必须通过点(X,Y)。
(2)若纵坐标、横坐标无折断号,将此线左端延长与纵轴相交,焦点的纵坐标必等于截距a。
(3)直线是否在自变量X的实测范围内。
2.答:SS总即(Y-Y),为反应变量Y的离均差平方和,表示在未考虑X与Y的回归关系时Y的变异,可分解为两部分的变异,一部分为回归平方和,另一部分为剩余平方和,分别用SS回和SS剩表示。这三个平方和,各有其相应的自由度?,其关系为:
?2?总=?回+?残,
?总?n?1,?回=1,?残=n-2。
3.答:SY表示在总体中,当X为某一定值时,个体Y值的波动范围。而剩余标准差
SY,X是指当X对Y的影响被扣除后,Y方面仍有变异。这部分变异与X无关,纯属抽样变
异。当X与X接近且充分大时,可用SY,X代替SY。
4.答:Y是X对应Y的总体均数的一个样本估计值,S?是反映其抽样误差大小的标
Y?准误,其计算公式为S??SYXY(x0?X)211(x0?X)2??SYX?;SY0是反映个体Y2n?(X?X)nlXX?值的容许区间大小的,也就是说当总体中X为某定值时,Y值由于随机误差影响在Y0上下波动的范围的大小就取决于标准差SY0,其计算公式为
SY0?SYX(x0?X)211(x0?X)21???SYX1??。
n?(X?X)2nlXX5.答:步骤如下:
(1)根于研究目的确定预报因子(X)和预报量(Y),由X估计Y值,收集资料。 (2)建立预报方程Y?a?bX,并进行回归系数假设检验。若P小于检验水准,则回归方程成立。
(3)根据回归方程在X实测范围内对Y进行预测,并计算X为某定值时,个体Y值波动范围(容许区间)。例如:1-7岁儿童,X为年龄,Y为体重,可根据年龄预测(估
?计)体重。
统计控制是利用回归方程进行逆估计,如要求因变量Y值在一定范围内波动,可以通过控制自变量X的取值来实现。步骤同前。例如:针刺哑门穴,进针深度Y与颈围X间存在直线关系,可根据X取值达到控制Y的目的。
6.答:
(1)Ⅰ型回归中,X为精密测定和严格控制的变量,Y为正态变量。表示原因的为
X,表示结果的为Y。
(2)Ⅱ型回归中,X、Y均为服从正态分布的随机变量,互为因果,可计算两个回归方程。何者为X,何者为Y,根据研究目的确定。如身高、体重两变量,若目的只是由身高估计体重,则确定X为身高,Y为体重。
7.答:曲线回归常用的几种曲线形式有: (1)指数函数(Y?e(a?bX)),当b>0时,Y随X上升而上升;当b<0时,Y随
X上升而下降。
(2)幂函数(Y?aX),当b>0时,Y随X上升而上升;当b<0时,Y随X上升而下降。
(3)对数函数(Y?a?blnX),当b>0时,Y随X上升而上升,先快后慢;当b<0时,Y随X上升而下降,先快后慢。
(4)logistic函数(Y?b1),当b>0时,Y随X上升而下降;当b<0时,a?bX1?eY随X上升而上升。
三、计算题 1.解: (1)计算获得:
?X?534,?X2?9876,?Y?99.2,?Y2?324.8,?XY?1750,
X?3.2,Y?17.23
534?99.2X?XY?Y?1750??41.20 ?????31??X?X?25342?9876??677.42
31X?X??Y?Y??412???0.061 代入公式:b?677.42X?X???a?Y?bX?3.2?0.061?17.23?2.15
??a?bX?21.5?0.061X Y(2)回归系数假设检验:
H0:??0,即孕妇尿中雌三醇含量与产儿体重有直线关系
H1:??0,即孕妇尿中雌三醇含量与产儿体重无直线关系 ??0.05
由上面的计算结果:
??X?X?2?677.42,??Y?Y??6.74,??X?X??Y?Y??4.12
241.22?6.74??4.23 ?677.424.230.38?0.15 SX.Y??0.38,Sb?31?2677.420.61?4.14 所以,t?0.15自由度v?31?2?29,查t值表,t0.01/2,29?2.756,P?0.01,按??0.05检验水
??Y?Y?2准,拒绝H0,认为待产妇24小时尿中雌三醇含量与产儿体重之间存在线性回归关系。
2.解:
(1) 散点图如下
5045403530252015105000.511.522.533.544.55氟含量(mg/L)氟含量与患病率的散点图患病率(%) (2) 由原始数据及散点图初步分析,估计本资料有直线趋势,故作下列计算
?X?15.96,?X?47.02,X?2.00
?Y?249.01,?Y?8468.78,Y?31.13,?XY?594.25
??X??47.02?15.96?15.18
l??X?n8??Y??8468.78?249.01?718.03
l??Y?n822222XX222YY