将总体被解释变量的条件期望表示为解释变量的某种函数,这个函数就称为总体回归函数,其一般表达式为:E(YXi)?f(,一元线性总体回归函数为Xi)E(YXi)??0??1Xi;样本回归函数:将被解释变量Y的样本观测值的拟和值表示为
????X。 ??f(X),一元线性样本回归函数为Y???解释变量的某种函数Yiii01i样本回归函数是总体回归函数的一个近似。总体回归函数具有理论上的意义,但其具体的参数不可能真正知道,只能通过样本估计。样本回归函数就是总体回归函数的参
?,??为?,?的估计值。 数用其估计值替代之后的形式,即?0101 3. 答:
可决系数R=ESS/TSS=1-RSS/TSS,含义为由解释变量引起的被解释变量的变化占被解释变量总变化的比重,用来判定回归直线拟合的优劣,该值越大说明拟合的越好;而残差平方和与样本容量关系密切,当样本容量比较小时,残差平方和的值也比较小,尤其是不同样本得到的残差平方和是不能做比较的。此外,作为检验统计量的一般应是相对量而不能用绝对量,因而不能使用残差平方和判断模型的拟合优度。 4. 答:
普通最小二乘法所保证的最好拟合是同一个问题内部的比较,即使用给出的样本数据满足残差的平方和最小;拟合优度检验结果所表示的优劣可以对不同的问题进行比较,即可以辨别不同的样本回归结果谁好谁坏。 5. 答:
在满足基本假设情况下,一元线性回归模型的普通最小二乘参数估计量是最佳线性无偏估计量。1、线性:参数估计量是被解释变量和随机误差项的线性组合2、无偏性:参数估计量的期望等于其真实值3、有效性:在所有的线性无偏估计量中,最小二乘估计量的方差是最小的。
6. 答:
最大似然法的基本思想是使从模型中取得样本观察数据的概率最大,即把随机抽取得到的样本观察数据看作是重复抽取中最容易得到的样本观察数据,即概率最大,参数估计结果应该反映这一情况,使得到的模型能以最大概率产生样本数据。
7. 答:
线性回归模型的基本假设(实际是针对普通最小二乘法的基本假设)是:解释变量是确
2
5
定性变量,而且解释变量之间互不相关;随机误差项具有0均值和同方差;随机误差项在不同样本点之间是独立的,不存在序列相关;随机误差项与解释变量之间不相关;随机误差项服从0均值、同方差的正态分布。违背基本假设的计量经济学模型还是可以估计的,只是不能使用普通最小二乘法进行估计。
五、计算分析题 1、解:
(1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上述简单回归模型中,它们被包含在了随机扰动项之中。有些因素可能与受教育水平相关,如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。
(2)当归结在随机扰动项中的重要影响因素与模型中的教育水平educ相关时,上述回归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰动项相关的情形,基本假设3不满足。 2、解:
(1)???N为接受过N年教育的员工的总体平均起始薪金。当N为零时,平均薪金为
?,因此?表示没有接受过教育员工的平均起始薪金。?是N每变化一个单位所引起的
E的变化,即表示每多接受一年教育所对应的薪金增加值。
?满足线性性、无偏性及有效性,因为这些性质的的成立无需随?和仍?(2)OLS估计量?机扰动项?的正态分布假设。
(3)如果?t的分布未知,则所有的假设检验都是无效的。因为t检验与F检验是建立在?的正态分布假设之上的。
(4)考察被解释变量度量单位变化的情形。以E*表示以百元为度量单位的薪金,则
E?E*?100????N??
由此有如下新模型
E*?(?/100)?(?/100)N?(?/100)
或 E*??*??*N??*
这里?*??/100,?*??/100。所以新的回归系数将为原始模型回归系数的1/100 (5)再考虑解释变量度量单位变化的情形。设N*为用月份表示的新员工受教育的时间长度,则N*=12N,于是
E????N??????(N*/12)??
或 E???(?/12)N*??
可见,估计的截距项不变,而斜率项将为原回归系数的1/12。
6
3、解:
(1)?为收入的边际储蓄倾向,表示人均收入每增加1美元时人均储蓄的预期平均变化量。
(2)由于收入为零时,家庭仍会有支出,可预期零收入时的平均储蓄为负,因此?符号应为负。储蓄是收入的一部分,且会随着收入的增加而增加,因此预期?的符号为正。实际的回归式中,?的符号为正,与预期的一致。但截距项为正,与预期不符。这可能是模型的错误设定造成的。如家庭的人口数可能影响家庭的储蓄行为,省略该变量将对截距项的估计产生了影响;另外线性设定可能不正确。
(3)拟合优度刻画解释变量对被解释变量变化的解释能力。模型中53.8%的拟合优度,表明收入的变化可以解释储蓄中53.8 %的变动。
(4)检验单个参数采用t检验,零假设为参数为零,备择假设为参数不为零。在零假设下t 分布的自由度为n-2=36-2=34。由t分布表知,双侧1%下的临界值位于2.750与2.704之间。斜率项的t值为0.067/0.011=6.09,截距项的t值为384.105/151.105=2.54。可见斜率项的t 值大于临界值,截距项小于临界值,因此拒绝斜率项为零的假设,但不拒绝截距项为零的假设。 4、解:
(1)这是一个横截面序列回归。
(2)截距2.6911表示咖啡零售价为每磅0美元时,每天每人平均消费量为2.6911杯,
这个数字没有经济意义;斜率-0.4795表示咖啡零售价与消费量负相关,价格上升1美元/磅,则平均每天每人消费量减少0.4795杯; (3)不能;
(4)不能;在同一条需求曲线上不同点的价格弹性不同,若要求出,须给出具体的X值
及与之对应的Y值。
5、解:
能用一元线性回归模型进行分析。因为: 对方程左右两边取对数可得:lnyi?lnA??2ln(xi?5)??i
lnA??0、 ??1、 ln(xi?5)?xi? 令lnyi?yi?、2可得一元线性回归模型:yi? ??0 ??1xi???i
7
?6、解:
列表计算得
x?3365.556 y?2802.778?y??116951422.22?xi?1nn
??xi?12?148063044.44据此可计算出
???1?y??x??xi?1i?1n2n?116951422.22?0.789876148063044.44
??y???x?01 ?2802.778?0.789876?3365.556 ?144.4067?i?144.4067?0.789876回归直线方程为 :yxi
进一步列表计算得:这里,n=18,所以:
?ei?1n2i?153857.8
1n2????ei?n?2i?11 ??153857.8
18?2 ?9616.1127、解:
(1)建立回归模型: Yi??1??2Xi?ui
(Xi?X)(Yi?Y)?xiyi334229.09??用OLS法估计参数: ?2????0.7863 22(X?X)x425053.73?i?i??Y???X?549.8?0.7863?647.88?66.2872 ?12??66.2872?0.7863X 估计结果为: Yii说明该百货公司销售收入每增加1元,平均说来销售成本将增加0.7863元。 (2)计算可决系数和回归估计的标准误差 可决系数为:
8
R2
?y???y22i2i?x)(????y2i2i2??2x2?2?i?y2i
?由 r20.7863?425053.73262796.99??0.999778262855.25262855.25 可得
2i222e?(1?R)y?i?i
?e?1??y2i2i
?e?(1?R2)?yi2?(1?0.999778)?262855.25?58.3539
??回归估计的标准误差: ??e??22i(n?2)?58.3539(12?2)?2.4157
(3) 对?2进行显著水平为5%的显著性检验
t?^*????22?)SE(?2^????)SE(?22i^~t(n?2)
?)?SE(?2?x??2.41572.4157??0.0037
425053.73651.9614 t?*??2?)SE(?2^0.7863?212.5135
0.0037* 查表得 ??0.05时,t0.025(12?2)?2.228 表明?2显著不为0,销售收入对销售成本有显著影响. (4) 假定下年1月销售收入为800万元,利用拟合的回归方程预测其销售成本,并给出置 信度为95%的预测区间。 ??66.2872?0.7863X?66.2872?0.7863?800?695.3272万元 Yii1(XF?X)2???预测区间为: YF?YF?t?2? 2nx?i1(800?647.88)2Y?695.3272?2.228?2.4157?? F12425053.73 ?695.3272?1.9978 8、解: (1)由第一个正规方程 ?et?0得 9