Yi????Xi??Zi?ui (2)
求β的最小二乘估计值。
解答:将模型(1)改写成(Yi?2Zi)????Xi?ui,则?的估计值为:
????(Xi?X)(Yi?2Zi?Y?2Z)?(Xi?X)2
将模型(2)改写成Yi????(Xi?Zi)?ui,则?的估计值为:
????(X?Z?X?Z)(Y?Y)
?(X?Z?X?Z)ii2ii此例表明:我们可以对模型中的变量进行变量变换。
这种代换不但可以对线性变量进行形式变换,而且可以将非线性变量变为线性变量,从而把可线性化的非线性模型变换为线性模型。而非线性的参数却很难变为线性参数,所以模型的参数非线性问题是很难处理的。
为什么计量经济学模型大都采用线性函数?
解答:第一,现实中的经济问题有一部分确实是线性的;第二,有一些非线性的经济问题在用线性模型表示(替代)后,误差不大,所以,完全可以采用线性模型进行替代;第三,很多非线性问题,通过变量的变换,都可以转化为线性模型。所以,计量经济学主要采用线性函数是有可靠的现实依据的。
8. 设有两个消费函数的计量经济模型
(a) Y?137.47?0.773X(5.87)R2?0.86??(10.65)n?25
(b) Y?254.27?0.216X(4.372)R2?0.89(?2.54)n?20
其中:Y表人均消费支出,X表人均可支配收入,括号中数值为t统计量的计算值。
要求:(1)选择你认为合理的模型,并说明你的理由。
26
(2)对你选择的模型,给出斜率的经济意义解释(单位为美元)。 解答:(1)合理的应模型为(a),原因是边际消费倾向(X的系数)不可能为负值,这样,才符合理论预期。
因为,经济意义检验是第一位的,是首要的。在经济意义合理的情况下(经济意义检验通过后),再对不同模型的统计检验指标进行比较。
(2)当人均可支配收入增加1美元时,人均消费支出平均增加0.773美元。
比较和选择模型的一般程序是:
(1)考察参数估计值(变量系数)的经济意义,即,进行经济检验,这是首先要做的,是第一位的;(2)第二步,在各模型的经济检验都通过的情况下,再考察各模型的解释变量是否通过了t检验;(3)第三步,在(1)(2)步都通过的情况下,再看哪个模型的判定系数的值最大,就选哪个模型为合理(理想、最佳或最终)的模型。
9.观察下列方程并判断其变量和系数是否呈线性?进一步的问题:哪些模型可转化为线性模型?哪些不能?哪些本身就是线性模型?
(1)Yi??0??1Xi3??i (2)Yi??0??1(?2Xi)??i (3)Yi??0??i (4)Yi??0??1X1i??2X2i10??i ?1Xi解答:(1)变量非线性、系数线性;(2)变量线性、系数非线性; (3)变量、系数均为非线性;(4)变量、系数均为线性.
(1)可进行变量线性化,可转化为线性模型;(2)(3)参数无法线性化,无法转化为线性模型(4)本身就是线性模型。(关于计量经济模型结构的线性的特点或定义请参见教材P51)。
10. lnY?0.47?0.32lnX,X为企业销售收入,Y为研发支出(R&D),问:X增加1%和10%,Y增加的比例?
解答:0.32×1%=0.32%,;0.32×10%=3.2%。
27
?
11. 考虑如下两个回归方程(根据1946—1975年的美国数据)(括号中给出的是标准差):Ct?26.19?0.624GNPt?0.4398Dt
se:(2.73)(0.0060) (0.0736)
R2=0.999
1?C??D??25.92?0.6246?0.4315 ????GNPGNPGNP??t??tt(0.0597) se: (2.22) (0.0068)R2=0.875
式中,C为总私人消费支出;GNP为国民生产总值;D为国防支出;t为时间。 研究的目的是确定国防支出对经济中其他支出的影响。
(1)将第一个方程变换为第二个方程的原因是什么?
(2)如果变换的目的是为了消除或者减弱异方差,那么我们对误差项要做哪些假设?
(3)如果存在异方差,是否已成功地消除异方差?请说明原因。 (4)变换后的回归方程是否一定要通过原点?为什么? (5)能否将两个回归方程中的R2加以比较?为什么? 解答:(1)原因有二:
第一,将被解释变量和解释变量均转换为支出与GNP的比值,可以表示出该项支出在国民生产总值中的比重,这更加强了模型对于经济现象的解释作用。
第二,有可能是因为该模型中出现了异方差的现象,转换方程是想变异方差为同方差,为了使估计结果为BLUE估计量。
(2)误差项?i的期望为零,方差为GNPi2,即
E??i??0,var??i??GNPi2
(3)基于(2)的假设,通过这样的转换,转换后模型的随机误差项?i*已具有如下特点:
??i? E????E??GNP???0
i??*i?i*??E?? va?r
*2i???i?12????E??E??1 i2?GNP?GNiPi??28
2这样的误差项已符合使用OLS获得良好估计的假定,可以说是已消除了异方差。
(4)变换后的回归模型是不一定通过原点的。
?D??C?在本例中,变换后的模型解释变量为?,被解释变量为,而????GNP?t?GNP?t1这一项近似地等于零,可以忽略不计。因此,模型中还有一个正截距,不GNPt会通过原点。
(5)不能单纯地用R2的值对两个回归方程进行比较。
虽然,R2值表示的是解释变量对被解释变量的解释程度的大小,R2越接近1,表示模型的解释能力越强。但是,在本例中,由于原始模型中的误差项具有异方差性质,这时R2值的大小是受到怀疑的,因为有可能是异方差的存在,影响了模型的R2值。所以转换前后模型的R2孰小孰大,并不能据此判断两个模型的解释能力孰弱孰强,需要进行更深入和具体的分析。
12.在研究生产函数时,得到以下两种结果:
?t=-5.04 + 0.8871nKt + 0.8931nLt (A) 1nY S.E.= (1.40) (0.087) (0.137) R2=0.878 n=21
?t=-8.57 + 0.0272t + 0.4601nKt + 1.2851nLt (B) 1nYS.E.= (2.99) (0.020) (0.333) (0.324) R2=0.889 n=21
其中,Y=产量,K=资本,L=劳动,t=时间,n=样本容量。
请回答:
(1) 验证模型(A)中所有的系数在统计上都是显著的(5%); (2) 验证模型(B)中t和lnK的系数在统计上不显著(5%); (3) 可能什么原因造成了(B)中lnK的系数不显著;
(4) 如果t与lnK的相关系数为0.98,你将如何判断并能得出什么结论? 解答: (1) 模型(A)中三个系数对应的t统计量分别为:
?5.040.8870.893=-3.6 =10.195 =6.5182 1.400.0870.137查t分布临界值表得t0.025(18)=2.101,模型(A)中三个系数t统计量的绝对值
29
均大于临界值2.101,因此所有的回归系数在统计上都是显著的。
(2) 模型(B)中t和lnK的系数对应的t统计量分别为:
0.02720.460=1.36 =1.38
0.02000.333查t分布临界值表得t0.025(17)=2.11,模型(B)中t和lnK的系数对应的t统计量绝对值均小于临界值2.11,因此回归系数在统计上不显著。
(3) 造成模型(B)中lnK系数不显著的原因是由于新变量t的引入,t与lnK之间可能存在严重的多重共线性。
(4) t与lnK的相关系数为0.98,表明两者相关程度很高,模型(2)存在严重的多重共线性。
13.某地区供水部门利用最近15年的用水年度数据得出如下估计模型:
?=-326.9 + 0.305HO + 0.363PO – 0.005RE – 17.87PR – 1.123RA W (-1.7) (0.9) (1.4) (-0.6) (-1.2) (-0.8)
R2=0.939 F=38.9
其中,W(Water)—用水总量(百万立方米),HO(House)—住户总数(千户),PO(Population)—总人口(千人),RE(Revenue)—人均收人(元),PR(price)—价格(元/100立方米),RA(rain)—降雨量(毫米)。
(1) 根据经济理论和直觉,预计回归系数的符号是什么(不包括常量)? 为什么? 观察符号与你的直觉相符吗?
(2) 在10%的显著性水平下,请进行变量的t检验与方程的F检验。t检验与F检验结果有相矛盾的现象吗?
(3) 你认为估计值是①有偏的;②无效的或③不一致的吗? 详细阐述理由。 解答: (1) 在其他变量不变的情况下,一城市的人口越多或房屋数量越多,则对用水的需求越高。所以可期望HO和PO的符号为正;收入较高的个人可能用水较多,因此RE的预期符号为正,但它可能是不显著的;如果水价上涨,则用户会节约用水,所以可预期PR的系数为负;如果降雨量较大,则草地和其他花园或耕地的用水需求就会下降,所以可以期望RA的系数符号为负。从估计的模型看,除了RE之外,所有符号都与预期相符。
(2) t统计量检验单个变量的显著性,F统计量检验回归方程总体线性显著与
30