应用回归分析试题(一)
一、选择题.(每题3分,共15分)
题号 答案 1 2 3 4 5
1、对于一元线性回归yi??0??1xi??i(i?1,2,...,n),E(?i)?0,var(?i)??2,
cov(?i,?j)?0(i?j),下列说法错误的是
?,?? 都是无偏估计; (A)?0,?1的最小二乘估计?01?,??对y,y,...,y是线性的; (B)?0,?1的最小二乘估计?n1201?,??之间是相关的; (C)?0,?1的最小二乘估计?01(D)若误差服从正态分布,?0,?1的最小二乘估计和极大似然估计是不一样的.
2、在回归分析中若诊断出异方差,常通过方差稳定化变化对因变量进行变换. 如果误差方差与因变量y的期望成正比,则可通过下列哪种变换将方差常数化 (A)
1y;(B) y;(C) ln(y?1);(D)lny.
3、下列说法错误的是
(A)强影响点不一定是异常值;
(B)在多元回归中,回归系数显著性的t检验与回归方程显著性的F检验是等价的; (C)一般情况下,一个定性变量有k类可能的取值时,需要引入k-1个0-1型自变量; (D)异常值的识别与特定的模型有关.
4、下面给出了4个残差图,哪个图形表示误差序列是自相关的
e102345678 (A)
(B) x
(C) (D)
5、下列哪个岭迹图表示在某一具体实例中最小二乘估计是适用的
(A) (B)
(C) (D)
二、填空题(每空2分,共20分)
221、考虑模型y?X???,var(?)??In,其中X:n?p?,秩为p?,??0不一定
??__________________, var(??)?___________,若?服从正态分布,则 已知,则??(n?p?)?2?2?2是?2的无偏估计. ?___________,其中?2、下表给出了四变量模型的回归结果:
来源 回归 残差 总的 平方和 65965 --- 66042 自由度 --- --- 14 均方 --- --- 则残差平方和=_________,总的观察值个数=_________,回归平方和的自由度=________. 3、已知因变量y与自变量x1,x2,x3,x4,下表给出了所有可能回归模型的AIC值,则最优子集是_____________________.
模型中的变量 AIC 202.55 2.68 142.49 62.44 3.04 198.10 315.16 模型中的变量 AIC 3.50 5.00 7.34 138.23 2.12 5.50 138.73 x1 x1,x2x2 x2,x3 x1,x2,x3 x1,x3 x3 ,x4 x1,x2,x3,x4 x2,x3,x4 x2,x4 x1,x2,x4 x1,x4 x4 x1,x34、在诊断自相关现象时,若DW?0.66,则误差序列的自相关系数?的估计值=_____ ,若存在自相关现象,常用的处理方法有迭代法、_____________、科克伦-奥克特迭代法. 5、设因变量y与自变量x的观察值分别为y1,y2,...,yn和x1,x2,...,xn,则以x*为折点的折线模型可表示为_____________________.
三、(共45分)研究货运总量y(万吨)与工业总产值x1(亿元)、农业总产值x2(亿元)、居民非商品支出x3(亿元)的线性回归关系.观察数据及残差值ei、学生化残差SREi、删除学生化残差SRE(i)、库克距离Di、杠杆值chii见表一
表一
编号 1 2 3 4 y x1 70 75 65 74 x2 35 40 40 42 x3 ei 1.0 -15.474 2.4 12.825 2.0 5.344 3.0 -0.091 SREi -0.894 0.628 0.265 -0.004 SRE(i) Di 0.166 0.031 0.006 1.168E-6 chii 0.454 0.240 0.261 0.199 160 260 210 265 -0.876 0.593 0.243 -0.004 5 6 7 8 9 10 240 220 275 160 275 250 72 68 78 66 70 65 38 45 42 36 44 42 1.2 33.225 1.5 -25.198 4.0 -17.554 2.0 -20.007 3.2 8.234 3.0 18.695 1.754 -2.116 -1.173 -1.163 0.409 1.065 2.294 -3.832 -1.220 -1.206 0.379 1.079 0.409 3.216 0.501 0.289 0.015 0.222 0.347 0.742 0.593 0.461 0.264 0.439
表二 参数估计表
变量 Intercept 系数 -348.280 3.754 7.101 12.447 标准误 176.459 1.933 2.880 10.569 x1 x2 x3 总平方和SST=16953 残差平方和SSE=3297
已知t0.025(6)?2.447,t0.025(7)?2.365,F0.05(3,6)?4.76,F0.05(4,7)?4.12,根据上述结果,解答如下问题:
1、计算误差方差?2的无偏估计及判定系数R2.(8分)
2、对x1,x2,x3的回归系数进行显著性检验.(显著性水平??0.05)(12分)
3、对回归方程进行显著性检验.(显著性水平??0.05)(8分)
4、诊断数据是否存在异常值,若存在,是关于自变量还是关于因变量的异常值?(10分)
5、写出y关于x1,x2,x3的回归方程,并结合实际对问题作一些基本分析(7分)
四、(共8分)某种合金中的主要成分为金属A与金属B,研究者经过13次试验,发现这两种金属成分之和x与膨胀系数y之间有一定的数量关系,但对这两种金属成分之和x是否对膨胀系数y有二次效应没有把握,经计算得y与x的回归的残差平方和为3.7,y与x、
x的回归的残差平方和为0.252,试在0.05的显著性水平下检验x对y是否有二次效应?
2(参考数据F0.05(1,10)?4.96,F0.05(2,10)?4.1)
五、(共12分)(1)简单描述一下自变量x1,x2,...,xp之间存在多重共线性的定义;(2分) (2)多重共线性的诊断方法主要有哪两种?(4分) (3)消除多重共线性的方法主要有哪几种?(6分)