总的变动中由回归模型解释部分越大,即回归模型的拟合程度越好,R越接近于0,说明Y总的变动中由回归模型解释部分越小,即回归模型的拟合程度越差。
? 仍以上面的支出方程为例,我们已经估算方程的形式为: ? Y = 4.538 + 0.750*X
? 即收入每增加1单位,消费增加0.75单位。边际消费倾向为0.75。 ? 计算其决定系数,可得:
? R=0.933
? 说明该支出方程可以解释93%的支出行为。
六、回归系数估计值的显著性检验与置信区间
1、估计量的分布特征
2经典的正态回归模型假定每个ui都是正态分布的随机变量,且其均值为0,方差为?u,即 2ui~N(0,?u)
22ui正态分布的图示:
0 为什么做正态性假定?理由:
ui (1)、我们前面指出,ui代表许多模型中没有引进的自变量的总影响,我们希望这些被忽略的变量说引起的影响是微小的,而且是随机的,利用数理统计中的中心极限定理,我们知道,如果存在大量的独立且相同分布的随机变量,那么,随着这些变量的无限增大,他们的总和将趋向于正态分布。 (2)、中心极限定理的另外一个解说就是,即使变量的个数不是很大而且还不是严格独立的,他们的总和仍可视同正态分布。
正态分布的一个性质就是,正态分布变量的任何线性函数都是正态分布。因此,在正态分布
11
假定下,我们很容易可以得到OLS估计量的概率分布。
前面已经假定ui服从正态分布,因为ui是影响Yi的随机函数,所以Yi也服从正态分布。
?,??为Y的线性组合,因此??,??也服从正态分布。 ?i1212?1~N(?1,???u2?Xi2n?xi2)
?2~N(?2,2x?i?u2)
?,??的正态分布图参P90。 ?12
?i的方差来代替。 ui是一个无法测量的量,因而不可能计算出ui的方差,只能用它的估计值u2?u??Se2?u??2in?2
2?,??的标准差为: 可以证明Se2为?u的无偏估计量。则?1222?uX?i?i????S????11n(n?2)?xi2??u(n?2)?x2i2i
????S????22
2、置信区间
?是根据样本回归得出的,它并不是真实的参数系数?,? 思想:由于参数的系数?22我们需要知道根据样本回归出来的参数估计值离实际值究竟有多远。给出任意正数
???,????)称为???,????)包含?的概率为1??,则称(??,随机区间(?22222?295%的置信区间,记为:
???,????)?1??, ? P(?22
根据t分布构造置信区间:
12
t?????22S??2~tn?2
给出置信度1??,查自由度为n-2的t分布表,得临界值
t?(n?2)。t值落在?t?2?t?t?2的概率为1??,即:
2P??t?2?t?t?2??1??
代入t,有:
????????22P??t?2??t?2??1??
S????2????tS???????tS?即:P?2?2?22?2?2?2??1??
则总体回归系数的1??置信区间为:
??tS?,???tS? ?2??2?2?2?2?22??
? 例:根据前面的数据(样本容量为30),估算出来的回归方程为:
? Y = 4.538 + 0.750*X
?的标准误为0.037,求?95%的置信区间。 ? 计算?22? 查t分布表,有:
t?(n?2)?t0.025(30?2)?2.048 2则?295%的置信区间为:
{0.75?2.048?0.037,0.75?2.048?0.037} ,0.826} 即: ?295%的置信区间为:{0.6742
3、回归系数的显著性检验——t检验
?,??的t统计量为: 来自单一样本的估计值?12t?????22S??2~tn?2
具有n-2个自由度,(样本为n,解释变量为2个)
? 其中n-2为残差的自由度,因为样本有n个变量,在一元回归中,待估计的参数有
两个,这两个参数为独立的约束,因此残差的自由度为n-2个。 ? 在多元回归模型中,如果待估计的参数有k个,则自由度为n-k个。
13
在计量经济学中,通常用t统计量检验真实总体参数为0的这一假设。t检验的步骤为: A、提出原假设:H0:?2?0 备选假设:H1:?2?0 B、计算t???2S??2
C、给出显著水平?,查自由度为n-2的t分布表,得临界值t?(n?2)。
2显著水平可以根据实际情况选取,如1%、5%、10%等。
D、作出判断。
如果t?t?(n?2),接受原假设H0:?2?0,表明X对Y无显著影响。一元回归模型无意
2义。
如果t?t?(n?2),拒绝原假设H0:?2?0,接受备选假设,表明X对Y有显著影响。
2
?的检验类似。 对?1
? 例:支出函数的参数检验.
? 对某个样本人群(n=30)的支出(Y)与收入(X)的调查数据如下: 从散点图可以看出,支出Y与X呈一线性关系,可以建立一个线性回归模型。
1008060Y4020204060X80100
? 对支出与收入建立一个线性模型: ? Yi??1??2Xi?ui ? ? ? ?
利用数据估算模型的参数,可以得到: Y = 4.538 + 0.750*X 检验参数的显著性:
计算t统计量(以 为例)
14
? ? ? ? ? ? ? ? ?
? ?0.7502t???19.756 ?0.037Se(?2)
假设显著性水平设为5%,查t分布表,有:
t(n?2)?t0.025(30?2)?2.048 ?2 由于
t(n?2)?t0.025(30?2)?2.04819.756> ?2? 因此在5%的显著性水平上拒绝 H0:?2?0的原假设,即H1:?2?0。经济含义
是说明收入对支出有显著的影响(这种影响显著的不等于0)。
4、预测 A、点预测。
已知解释变量X的一个特定值X0,代入样本回归方程,得到Y0的估计值:
????X ???Y0120B、区间预测 构造t统计量:
??YYt?00~tn?2
?(u0)?给出置信度1??,查自由度为n-2的t分布表,得临界值t?(n?2)。t值落在
2?t?2?t?t?2的概率为1??,即: P??t?2?t?t?2??1??
代入t,有:
??Y??YP??t?2?00?t?2??1??
?(u0)?????t???(u0)?1?? 即:PY0?2?(u0)?Y0?Y0?t?2?则总体回归系数的1??置信区间为:
????t???(u0) Y0?Y0?2?(u0),Y0?t?2??(u0)的表达式见P123(5.10.6)其中:?。(证明过程略)
2?? 15