应用回归分析试题(一)
1、对于一元线性回归yi??0??1xi??i(i?1,2,...,n),E(?i)?0,var(?i)??2,
cov(?i,?j)?0(i?j),下列说法错误的是
?,?? 都是无偏估计; (A)?0,?1的最小二乘估计?01?,??对y,y,...,y是线性的; (B)?0,?1的最小二乘估计?n1201?,??之间是相关的; (C)?0,?1的最小二乘估计?01(D)若误差服从正态分布,?0,?1的最小二乘估计和极大似然估计是不一样的.
2、在回归分析中若诊断出异方差,常通过方差稳定化变化对因变量进行变换. 如果误差方差与因变量y的期望成正比,则可通过下列哪种变换将方差常数化 (A)
3、下列说法错误的是
(A)强影响点不一定是异常值;
(B)在多元回归中,回归系数显著性的t检验与回归方程显著性的F检验是等价的; (C)一般情况下,一个定性变量有k类可能的取值时,需要引入k-1个0-1型自变量; (D)异常值的识别与特定的模型有关.
4、下面给出了4个残差图,哪个图形表示误差序列是自相关的
e1023456781;(B) y;(C) ln(y?1);(D)lny. y (A)
(B) x
(C) (D)
5、下列哪个岭迹图表示在某一具体实例中最小二乘估计是适用的
(A) (B)
(C) (D)
二、填空题(每空2分,共20分)
1、考虑模型y?X???,var(?)??2In,其中X:n?p?,秩为p?,??0不一定
2??__________________, var(??)?___________,若?服从正态分布,则 已知,则??2(n?p?)??2是?2的无偏估计. ?___________,其中??22、下表给出了四变量模型的回归结果:
来源 回归 残差 总的 平方和 65965 --- 66042 自由度 --- --- 14 均方 --- --- 则残差平方和=_________,总的观察值个数=_________,回归平方和的自由度=________.
3、已知因变量y与自变量x1,x2,x3,x4,下表给出了所有可能回归模型的AIC值,则最优子集是_____________________.
模型中的变量 AIC 202.55 2.68 142.49 62.44 3.04 198.10 315.16 模型中的变量 AIC 3.50 5.00 7.34 138.23 2.12 5.50 138.73 x1 x1,x2 x2 x2,x3 x1,x2,x3 x1,x3 x3 x1,x3,x4 x1,x2,x3,x4 x2,x3,x4 x2,x4 x1,x2,x4 x1,x4 x4 4、在诊断自相关现象时,若DW?0.66,则误差序列的自相关系数?的估计值=_____ ,若存在自相关现象,常用的处理方法有迭代法、_____________、科克伦-奥克特迭代法. 5、设因变量y与自变量x的观察值分别为y1,y2,...,yn和x1,x2,...,xn,则以x为折点的折线模型可表示为_____________________.
三、(共45分)研究货运总量y(万吨)与工业总产值x1(亿元)、农业总产值x2(亿元)、居民非商品支出x3(亿元)的线性回归关系.观察数据及残差值ei、学生化残差SREi、删除学生化残差SRE(i)、库克距离Di、杠杆值chii见表一
表一
编号 1 2 3 4 5 6 7 8 9 10 *y 160 260 210 265 240 220 275 160 275 250 x1 x2 x3 ei 70 75 65 74 72 68 78 66 70 65 35 40 40 42 38 45 42 36 44 42 1.0 -15.474 2.4 12.825 2.0 5.344 3.0 -0.091 1.2 33.225 1.5 -25.198 4.0 -17.554 2.0 -20.007 3.2 8.234 3.0 18.695 SREi SRE(i) Di 0.166 0.031 0.006 1.168E-6 0.409 3.216 0.501 0.289 0.015 0.222 chii 0.454 0.240 0.261 0.199 0.347 0.742 0.593 0.461 0.264 0.439 -0.894 -0.876 0.628 0.265 0.593 0.243 -0.004 -0.004 1.754 2.294 -2.116 -3.832 -1.173 -1.220 -1.163 -1.206 0.409 1.065 0.379 1.079
表二 参数估计表
变量 Intercept 系数 -348.280 3.754 7.101 12.447 标准误 176.459 1.933 2.880 10.569 x1 x2 x3 总平方和SST=16953 残差平方和SSE=3297
已知t0.025(6)?2.447,t0.025(7)?2.365,F0.05(3,6)?4.76,F0.05(4,7)?4.12,根据上述结果,解答如下问题:
1、计算误差方差?的无偏估计及判定系数R.(8分)
2、对x1,x2,x3的回归系数进行显著性检验.(显著性水平??0.05)(12分) 3、对回归方程进行显著性检验.(显著性水平??0.05)(8分)
4、诊断数据是否存在异常值,若存在,是关于自变量还是关于因变量的异常值?(10分) 5、写出y关于x1,x2,x3的回归方程,并结合实际对问题作一些基本分析(7分) 四、(共8分)某种合金中的主要成分为金属A与金属B,研究者经过13次试验,发现这两种金属成分之和x与膨胀系数y之间有一定的数量关系,但对这两种金属成分之和x是否对膨胀系数y有二次效应没有把握,经计算得y与x的回归的残差平方和为3.7,y与x、
2
2x2的回归的残差平方和为0.252,试在0.05的显著性水平下检验x对y是否有二次效应?
(参考数据F0.05(1,10)?4.96,F0.05(2,10)?4.1)
五、(共12分)(1)简单描述一下自变量x1,x2,...,xp之间存在多重共线性的定义;(2分) (2)多重共线性的诊断方法主要有哪两种?(4分) (3)消除多重共线性的方法主要有哪几种?(6分)
应用回归分析试题(二)
一、选择题
1. 某同学由x与y之间的一组数据求得两个变量间的线性回归方程为y?bx?a,已知:数据x 的平均值为2,数据y的平均值为3,则 ( A )
A.回归直线必过点(2,3) B.回归直线一定不过点(2,3)
C.点(2,3)在回归直线上方 D.点(2,3)在回归直线下方
2. 在一次试验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则Y与X之间的回归直线方程为( A ) ??x?1 B.y??x?2 C.y??2x?1 D.y??x?1 A.y3. 在对两个变量x,y进行线性回归分析时,有下列步骤:
①对所求出的回归直线方程作出解释; ②收集数据(xi、yi),i?2,1,…,n;
③求线性回归方程; ④求未知参数; ⑤根据所搜集的数据绘制散点图
如果根据可行性要求能够作出变量x,y具有线性相关结论,则在下列操作中正确的是( D )
A.①②⑤③④ B.③②④⑤① C.②④③①⑤ D.②⑤④③①
4. 下列说法中正确的是(B )
A.任何两个变量都具有相关关系 B.人的知识与其年龄具有相关关系
C.散点图中的各点是分散的没有规律 D.根据散点图求得的回归直线方程都是有意义的
5. 给出下列结论:
(1)在回归分析中,可用指数系数R2的值判断模型的拟合效果,R2越大,模型的拟合效果越好;
(2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好;
(3)在回归分析中,可用相关系数r的值判断模型的拟合效果,r越小,模型的拟合效果越好;
(4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高. 以上结论中,正确的有(B )个.
A.1 B.2 C.3 D.4 6. 已知直线回归方程为y?2?1.5x,则变量x增加一个单位时(C )
A.y平均增加1.5个单位 B.y平均增加2个单位C.y平均减少1.5个单位 D.y平均减少2个单位
7. 下面的各图中,散点图与相关系数r不符合的是(B )