??1?Y???2X ??i)(Yi?Y)i2??(X?X??xiy?(X?X)2?x2
ii
几个常用的结果:
由(1)可知残差的均值等于0,
?u?i?0 由(2)可知残差与解释变量不相关,?u?iXi?0
样本回归直线经过点(X,Y)
被解释变量的样本平均值等于其估计值的平均值
6
四、OLS的代数性质(Algebraic Properties): 1、OLS的代数性质 (1)线性性
??1,??2可以表示为Yi的线性组合,以??2为例 ???iiiiii2?xy??x(Y?Y)??xY?x2?x22?Y?xi2,由于
?xi?0,有:ii?xi?xi???xiYi2?i?x2??KiYi,其中Ki?x?x2
ii
(2)无偏性
??1,??2的数学期望等于总体回归系数?1,?2的值。以??2为例:
7
??KY?K(???X?u)?K?????ii?i12ii?i12?KiXi??Kiui 2由于
?Ki??xi?2?xi?x?xii2?0
22xiXiKX??ii?x2??i所以:?2??2??x(x?X)??x?x?xii2iiixX???xi2i?1
??Ku?E(??)?E(?)??KE(u)??ii22ii2
(3)最小方差性 证明略。(证明的思想:设参数的任意其他线性无偏估计,证明它们的方差大于最小二乘估计。参教材P84)
2、最小二乘法的精度与标准误差
?Var(?2)?Var(?2??Kiui)?Var(?Kiui)??u2?Ki由于:
2
?K2i2?xi?????2??x?i??x????x?2ii22
?12?xi因此有:Var(?2)???x2?u2i
?u2越大,?2的方差就越大,从而估计值越不准确,?xi2越大,?2的方差就越小,从而
就越有可能获得一个比较准确的估计值。 同样可以求得:Var(?1)?????u2?Xi2n?xi2
8
五、拟合度(Goodness-of-Fit):
? 如果所有的观测点都落在样本回归线上,我们就得到一个完美的拟合。但是,这种
?i和一些负的u?i,我们希望的是这些事情很少发生。一般的情形是,总有一些正的u围绕回归线的残差尽可能的小。
? 决定系数R就是告诉人们这条样本回归线对数据的拟合有多好的一个总度量。 2
300300250250200200YY150150100100505060801001201401606080100120140160XX
-Total Sum of Squares (SST)
总平方和
SST??(Yi?Y2i)
-Explained Sum of Squares (SSE) 解释平方和
9
SSE??(Y??Y)ii2
-Residual Sum of Squares (SSR) 残差平方和
2?)2??u?SSR??(Yi?Yii
SST?SSE?SSRproof:SST??(Yi?Yi)2?)?(Y??Y)]2??[(Yi?Yiii??Y)?(Y??Y)2]?i2?2u?i(Y??[uiiii??Y)??(Y??Y)2?i2??2u?i(Y??uiiii??Y)?i(Y?SSE?SSR??2uii?SSE?SSR
因为:
??Y)?(Y?2u????X?Y)?(???2u??Y)?2???(??X?2?u?u??Y)u?X?2(????2???uiiiii112iii22ii1iiii
?0SST?SSR?SSE1?SSRSSE?SSTSSTSSER2?SSTSSR?1?SST0?R2?1
或简写为:R2
?y???y2i2i?u??1??y2i2i
R2测度了在Y总的变动中由回归模型解释的那个部分所占的比例。R2越接近于1,说明Y
10