第四章多元线性回归模型

2020-05-11 12:12

第四章多元线性回归模型

在一元线性回归模型中，解释变量只有一个。但在实际问题中，影响因变量的变量可能不止一个，比如根据经济学理论，人们对某种商品的需求不仅受该商品市场价格的影响，而且受其它商品价格以及人们可支配收入水平的制约；影响劳动力劳动供给意愿（用劳动参与率度量）的因素不仅包括经济形势（用失业率度量），而且包括劳动实际工资；根据凯恩斯的流动性偏好理论，影响人们货币需求的因素不仅包括人们的收入水平，而且包括利率水平等。当解释变量的个数由一个扩展到两个或两个以上时，一元线性回归模型就扩展为多元线性回归模型。本章在理论分析中以二元线性回归模型为例进行。一、预备知识（一）相关概念

对于一个三变量总体，若由基础理论，变量x1,x2和变量y之间存在因果关系，或x1,x2的变异可用来解释y的变异。为检验变量x1,x2和变量y之间因果关系是否存在、度量变量x1,x2对变量y影响的强弱与显著性、以及利用解释变量

x1,x2去预测因变量y，引入多元回归分析这一工具。

将给定x1i,x2i条件下yi的均值

E(yi|x1i,x2i)??0??1x1i??2x2i （4.1）定义为总体回归函数（Population Regression Function,PRF）。定义

yi?E(yi|x1i,x2i)为误差项（error term）,记为?i，即?i?yi?E(yi|x1i,x2i)，这样yi?E(yi|x1i,x2i)??i，或

yi??0??1x1i??2x2i??i （4.2）

（4.2）式称为总体回归模型或者随机总体回归函数。其中，x1,x2称为解释变量（explanatory variable）或自变量（independent variable）；y称为被解释变量（explained variable）或因变量（dependent variable）；误差项?解释了因变量的变动中不能完全被自变量所解释的部分。

在总体回归模型（4.2）中参数?0,?1,?2是未知的，?i是不可观察的，统计计量分析的目标之一就是估计模型的未知参数。给定一组随机样本

(yi,x1i,x2i),i?1,2,?,n，对（4.1）式进行估计，若E(yi|x1i,x2i),?0,?1,?2的估计量分别记为yi,?0,?1,?2，则定义（4.3）式为样本回归函数

yi??0??1x1i??2x2i （i?1,2,?,n）（4.3）

注意，样本回归函数随着样本的不同而不同，也就是说?0,?1,?2是随机变量，它们的随机性是由于yi的随机性（同一组(x1i,x2i)可能对应不同的yi）、x1,x2各

^^^^^^^^^^^自的变异、以及x1,x2之间的相关性共同引起的。定义yi?yi为残差项（residual term）,记为ei，即ei?yi?yi，这样yi?yi?ei，或

yi??0??1xi?ei （i?1,2,?,n）（4.4）（4.4）式称为样本回归模型或者随机样本回归函数。样本回归模型中残差项ei可视为总体回归模型中误差项?i的估计量。（二）多元线性回归模型的矩阵表示

多元线性回归模型的参数估计比一元线性回归模型要复杂得多，为了便于计算和分析，便于将结果由三变量总体推广到一般的多变量总体，引入矩阵这一工具简化计算和分析。

设(yi,x1i,x2i),i?1,2,?,n是取自总体的一组随机样本。在该组样本下，总体回归模型（4.2）式可以写成方程组的形式

^^^^^y1??0??1x11??2x21??1

y2??0??1x12??2x22??2

yn??0??1x1n??2x2n??n

利用矩阵运算，可表示为

?y1??1x11?y??1x212 ??????????????yn??1x1nx21?x22?????x2n???1???0?????????2? （4.5） ?1???????2??????n??y1??1x11?y??1x212记y???，X???????????y?n??1x1nx21???1????0???x22??,????1?,???2?

??????????????3?x2n???n?则在该组样本下，总体回归模型的矩阵表示为

y?X??? （4.6）

^????e1?0?^??e?^2??记???1,e???

?^??????2??????en???则样本回归模型的矩阵表示为

y?X??e （4.7）（三）模型假定

假定1 回归模型是参数线性的，并且是设定正确的。

^假定2 随机误差项与解释变量不相关。即

cov(xji,?i)?0，j?1,2。

如果解释变量是非随机的，则该假设自动满足。假定3 零均值假定。即

E(?i)?0，i?1,2,?,n

假定4 同方差假定。即

var(?i)??2，i?1,2,?,n

假定5 无自相关假定。即两个误差项之间不相关

cov(?i,?j)?0 i?j，i?1,2,?,n，j?1,2,?,n

假定6 解释变量x1与x2之间不存在完全共线性，即两个解释变量之间无确切的的线性关系。

假定7 正态性假定。即

?i～N(0,?2)，i?1,2,?,n

（四）参数估计与估计量的分布系数向量?的OLS估计为

??(XTX)?1XTy （4.8）其中，XT为X的转置矩阵。在随机误差项服从正态分布的假定下，系数向量的估计量也服从正态分布，即

?～N(?,?2(XTX)?1) （4.9）记C?(XTX)?1的第j个主对角元素为cjj，则

?j～N(?j,?2cjj) （4.10）

有了系数估计量的分布，就可以对总体参数做假设检验。与双变量总体相同，总体误差?i是不可观察的，因而其方差?是未知的。若用?的无偏估计量?2代

22^^^^替?2，则OLS估计量服从自由度为n?3的t分布，而不是正态分布，即

?j??jse(?j)^^～t(n?3) （4.11）

其中，se(?j)??2cjj，?2（五）预测原理

^^^e??2in?3。

回归分析的目的之一是利用回归模型预测因变量。假设三变量总体的回归模型为（4.2），即

yi??0??1x1i??2x2i??i （4.2）在一组随机样本(yi,x1i,x2i),i?1,2,?,n下，利用OLS求得样本回归函数为（4.3） yi??0??1x1i??2ix2i （i?1,2,?,n）（4.3）给定样本外一点xf?(1,x1f,x2f)T，则因变量yf的点预测为

yf??0??1x1f??2x2f （4.12）点预测yf的标准误为

T?1 se(yf)??1?xT f(XX)xf （4.13）

^^^^^^^^^^^因变量yf的置信度为1??的区间预测为

[yf?t?2(n?3)se(yf), yf?t?2(n?3)se(yf)] （4.14）

^^^^二、案例

[案例1] Woody餐馆的选址分析

Woody餐馆是一家价位适中、24小时营业的家庭连锁店，公司邀请你决策下一家连锁店的选址问题。你决定建立一个回归模型来解释每一家连锁餐馆的毛销售额Y（the gross sales volume）,通过文献的阅读，你认为以下变量对毛销售额的影响较大，

N =竞争变量：餐馆位置半径2里以内市场直接竞争者的数量； P=人口：餐馆位置半径3里以内人口的数量； I=收入：餐馆位置半径3里以内家庭平均收入。并且通过调研，你获得了33家Woody餐馆连锁店的数据。 [案例2] 经济形势和实际工资对人们工作意愿的影响

在第三章，我们根据劳动经济学理论，分析了经济形势对人们工作意愿的影响存在两种效应：受挫工人效应和增加工人效应；并且利用1980-2002年的数据实证了受挫工人效应占主导地位。

但根据劳动经济学理论，影响人们工作意愿的因素，除了经济形势以外，还有实际的工资水平。从理论上说，实际工资增加对劳动供给具有两种效应：替代效应与收入效应。替代效应趋于使劳动供给增加，而收入效应则趋于使劳动供给降低，两种效应的相对影响取决于家庭的偏好（参考文献[4]，p49）。

本案例考察实际工资对人们工作意愿是否有影响，以及在有影响的情况下，那种效应占优。数据见表3.1。三、实验目的

[案例1] Woody餐馆的选址分析

1、绘制Y对N、P、I的散点图，并在散点图中附加回归线。

2、建立Y对N、P、I的线性回归模型，并定性分析解释变量N、P、I对Y的影响。

3、利用样本数据及OLS法对回归模型进行估计，并报告回归结果。 4、观察回归系数的显著性和方程的显著性，并解释回归系数的含义。 [案例2] 经济形势和实际工资对人们工作意愿的影响

1、绘制clfpr对ahe82的散点图，并附回归线，观察城市劳动参与率与实际工资之间的线性关系。

2、建立clfpr对ahe82的一元线性回归模型，利用1980-2002年的数据估计模型，并观察回归系数的显著性和方程的显著性。

3、同时考虑经济形势与实际工资对人们工作意愿的影响，建立二元线性回归模型，利用1980-2002年的数据估计模型，观察回归系数的显著性和方程的显著性，并解释回归系数的经济含义。

4、对上面（2）与（3）中估计结果的差别进行解释。

5、模型的选择问题，在以下三个模型之间，哪个模型更好呢？

clfpr（Ⅰ） t??0??1cunrt??t clfpr（Ⅱ） 82t??t t??0??1ahe clfpr（Ⅲ） 82t??2cunrt??0??1ahet??t

四、实验原理五、实验步骤

[案例1] Woody餐馆的选址分析

180,000160,000140,000180,000160,000140,000180,000160,000140,000YY120,000100,00080,000024N6810120,000100,00080,0000100,000P200,000300,000Y120,000100,00080,00010,00020,000I30,00040,000 图4-1 Y对N、P、I的散点图

1、打开Eviews工作文件Woody.wfl，按住Ctrl键，点击工作文件目录中的序列Y、N、P、I图标，点击鼠标右键，点击Open/as Group，出现包含序列Y、N、P、I的组对象窗口。

点击组对象窗口工具栏的View按钮，选择Graph，在Specifi选项中选择

第四章多元线性回归模型.doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档

第四章 多元线性回归模型

第四章多元线性回归模型