第11章 一元线性回归
一、
思考题
16、简要说明残差分析在回归分析中的作用。
答:残差是因变量的观测值y与根据估计的回归方程求出的预测值之差,它反映了用估计的回归方程去预测y而引起的误差。 二、
练习题
7、随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行了调查,所得数据如下: 航班公司编号 1 2 3 4 5 6 7 8 9 10 要求: 航班正点率(%) 81.8 76.6 76.6 75.7 73.8 72.2 71.2 70.8 91.4 68.5 顾客投诉次数(次) 21 58 85 68 74 93 72 122 18 125 (1) 绘制散点图,说明二者之间的关系形态。
(2) 用航班正点率作自变量,顾客投诉次数作因变量,求出估计的回归方程,
并解释回归系数的意义。 (3) 检验回归系数的显著性(?=0.05)
(4) 如果航班正点率为80%,估计顾客投诉次数。
(5) 求航班正点率为80%时,顾客投诉次数95%的置信区间和预测区间。 解:
(1)
由图可以看出航班正点率与顾客投诉次数成负线性相关。 (2)
估计的回归方程为 y=-4.7006x+430.19
其回归系数为-4.7006,表示当航班正点率增加1%个单位时,顾客投诉次数减少4.7006次。
(3)提出假设:H0: b1 = 0 (没有线性关系)
H1: b1 ? 0 (有线性关系)
计算检验的统计量
??11~t(n?2) t?s????11 t =-4.959
确定显著性水平?,并进行决策
? t?>t???,拒绝H0;? t? ? t?=4.959> t??? =2.3060,拒绝原假设,回归系数显著。 (4)当x=80%时,y=430.19-4.7×80=54.19次,即投诉次数约为54.19次。 (5)已知?=0.05,t???(10-2)=2.3060,置信区间公式如下: ?0y?t?(n?2)see0?221?n?x00?x?22nn2??xii?x?2ii??11得出,置信区间为(37.7093,,7.6691) 预测区间估计公式为 1?0y?t(n?2)S1???e0?22en?x00?x?22nn22??x?x?iiii??11得出,预测区间为(7.6215,100.7569)。 14、从两个回归分析中得到的残差如下: 回归1 x 1 2 3 4 5 6 7 8 9 10 11 12 13 14 残差 0.70 -0.78 1.03 0.33 2.39 -0.67 0.16 1.65 -1.19 0.84 0.29 -1.28 1.21 -0.37 x 1 2 3 4 5 6 7 8 9 10 11 12 13 14 回归2 残差 0.70 1.58 1.03 0.33 -0.39 -0.67 -0.56 -0.65 -1.19 -0.84 -0.29 -1.28 -0.21 -0.37 15 1.02 16 -0.16 17 1.42 18 -0.71 19 -0.63 20 0.67 绘制残差图,你会得出什么结论? 15 16 17 0.22 -0.16 0.82 观察图像可以看出,回归1的残差值基本上集中在两条平行线之间,表明对于所有值,方差都相同,所以认定其假定描述变量x和y之间关系的回归模型是合理的。 而回归2对于不同的x值残差相差也较大,且其残差值基本上集中在两条曲线之间,这就意味着其违背了方差相等的,表明所选择的回归模型不合理,应该考虑曲线回归或多元回归。