(2) 在10%的显著性水平下,请进行变量的t检验与方程的F检验。t检验与F检验结果有相矛盾的现象吗?
(3) 你认为估计值是①有偏的;②无效的或③不一致的吗? 详细阐述理由。
解答: (1) 在其他变量不变的情况下,一城市的人口越多或房屋数量越多,则对用水的需求越高。所以可期望HO和PO的符号为正;收入较高的个人可能用水较多,因此RE的预期符号为正,但它可能是不显著的;如果水价上涨,则用户会节约用水,所以可预期PR的系数为负;如果降雨量较大,则草地和其他花园或耕地的用水需求就会下降,所以可以期望RA的系数符号为负。从估计的模型看,除了RE之外,所有符号都与预期相符。
(2) t统计量检验单个变量的显著性,F统计量检验回归方程总体线性显著与否,是联合检验。 这里t检验的自由度为15-5-1=9,在10%的显著性水平下的临界值为1.833。可见,所有参数估计值的t值的绝对值都小于该值,所以即使在10%的显著水平下这些变量也不是显著的。 这里,F统计值的分子自由度为5,分母自由度为9。10%显著性水平下F分布的临界值为2.61。显然计算的F值大于该临界值,表明回归系数是联合显著的。
t检验与F检验结果相矛盾可能是由于多重共线性造成的。HO、PO、RE都是高度相关的,这将使它们的t值降低且表现为不显著。PR和RA不显著另有原因。根据经验,如果一个变量的值在样本期间没有很大的变化,则它对被解释变量的影响就不能很好地被度量。通常情况下水价与年降雨量在各年中没有太大变化,所以它们的影响很难度量。
(3) 多重共线性往往表现的是解释变量间的样本相关现象,在不存在完全共线性的情况下,近似共线并不意味着基本假定的任何改变,所以OLS估计量的无偏性、一致性和有效性仍然成立,即仍是BLUE估计量。但共线性会导致参数估计值的方差大于不存在多重共线性的情况。
第六章 异方差性
1. 判断正误,并说明理由。 解答
(1) 错。当存在异方差时,OLS 估计量是无偏的但不具有有效性。 (2) 对。如果存在异方差,通常的T检验和F检验是无效的。
(3) 错。实际情况是可能高估也可能低估。 (4) 对。通过残差对其他相应的变量的观察值描图,了解变量与残差之间是否具有可以观察到
的系统模式,可以用来判断数据中是否存在异方差。 (5) 对。随机误差的异方差性通常与模型中的解释变量相关,因此异方差性检验不能独立于误差项和某一变量相关的假定。
(6) 对。如果模型存在设定误差,则可能出现随机误差的方差与解释变量相关的情况,OLS
残差就会表现出明显的系统模式。
2. 简述异方差对下述各项的影响。
解答 由于异方差性的存在,使得OLS估计量仍然是线性无偏但不再有最小方差性,即不再有效;而由于相应的置信区间以及T检验和F检验都与估计的方差相关,因此会造成建立的置信区间以及T检验和F检验都不再是可靠的。
3. 解答
(1) 方程(6-40)表明,当N增加一个单位时,平均而言工资W增加0.009个单位.如果用N乘上方程
31
(6-41)两边,结果就类似于(6-40).
(2) 作者显然担心回归方程存在异方差问题,因为他用N去除原来的方程两边.这意味则作者假定随机误差好项方差与N的平方成比例.因此作者在(6-41)中采用了加权最小二乘估计.
(3)方程(6-40)的截距系数就是方程(6-41)中的斜率系数,而方程(6-40)中的斜率系数就是方程(6-41)中的截距系数.
(4) 不能,因为两个模型中的被解释变量不同. 4.解答
(1) 在一元线性回归模型中,已知有
y???xx????1??x?x^iii212iii
因此有
E(?)?E(?)??11^^xE(?)???xi2ii1
2?xi???xxxVar(?)?Var(?)?Var()???Var()????1??2?x?x?x??xi??x????xi2?iiij12iii?j2i22ii22jCov(?,?)ij
(2) 由(1)中结果得到
?x?K???xKVar(?)?1??xi2??x?x^2iii222ii222i
而在同方差下, Var(?1)??^22i?x,它与异方差时的方差相差一个乘子?xiK?x2i2i.如果
Ki?1,则
该乘子大于1,则这样异方差时随机误差项方差大于同方差时的方差;而如果1?Ki?0,则异方差
时随机误差项方差小于同方差时的方差. 5 解答
(1) 他们假设了随机误差项方差与GNP的平方成比例.他们通过检查各个时期的数据观察到了这种关系.
(2) 结果基本上是相同的,尽管在第二个回归方程中两个系数的标准差比较低.但这仍然表明对异方差进行转换仍然是合理的.
(3) 不能,这里的R平方不能直接进行比较,因为两个模型中的被解释变量是不同的. 6 解答
(1) 首先建立居民人均消费支出与可支配收入的线性回归模型
32
Y????X??i01ii
对该模型OLS估计的结果如下:
^Yi?272.3635?0.755125X(2) 异方差性检验 首先做G-Q检验
i
(1.705713) (32.38690)
R^2=0.983129 F=1048.912 N=20
对20个样本按X从大到小排列,去掉中间4个观测值,对前后两个样本进行OLS估计,样本容量均为8.
第一个子样本回归结果为:
^Yi?212.2118?0.761893X(0.3997) (12.625)
i
R^2=0.96372,F=159.39, N=8, RSS1=615472.0 第二个子样本回归结果为:
^Yi?1277.161?0.554126Xi
(0.829) (1.779287)
R^2=0.345, F=3.1658, N=8, RSS2=126528.3
根据上面两个子样本回归得到的残差平方和,我们可以计算F统计量: F?RSS1/(8?1?1)615472.0/6??4.86
RSS2/(8?1?1)126528.3/6在5%的显著性水平下,自由度为(6,6)的F分布临界值为4.28,于是拒绝无异方差性假设,表明原模型存在异方差性。
其次采用怀特检验。在对原模型进行OLS估计后,做残差序列平方,然后做辅助回归。用该
残差序列平方对常数项、X的一次项和二次项进行回归,得到该辅助回归方程中的拟合优度和对应的拉格朗日乘子统计量(这些操作只要在对原模型进行OLS回归后,选择View/Residual Tests/White Heteroskedasticity就可已完成)。由辅助回归得到的LM统计量等于12.65213,伴随概率为0.001789.这表明在5%的显著性水平下,原模型存在异方差。 (3)采用对数线性模型进行估计,结果如下:
^
Yi?0.25?0.946Xi
(0.94) (31.4) R^2=0.98 F=985 n=20
对该回归结果进行怀特检验,得到LM=2.48,伴随概率为0.29,因此对数模型不存在异方差性问题,这表明通过取对数在一定程度上也可消除异方差问题,因为取对数后数据差异就变小了。
33
第七章 序列相关性
1. 判断正误,并说明理由。
(1)错,当存在序列相关时,OLS估计量仍然是无偏的,但不具有有有效性。 (2)对,应用DW统计量检验检验时仍然假定随机干扰项是同方差的。 (3)错,是假定自相关系数为+1。
(4)对,要比较模型的R^2,两个模型中的变量必须是一样的。 (5)对,这也可能是模型设定误差带来的显著的DW值。
(6)对,因为预测误差涉及到随机误差方差,而存在随机干扰项自相关时,OLS法不能正确估计随机误差方差。
(7)对,这可能是由于模型的误定义带来的显著的DW值。
(8)错,此时只能用B-W g统计量来检验,尽管我们使用了DW表来检验这一假设。 (9)对,写下如下模型:证。
2 解答
(1) 在一元线性回归模型中,已知有
Yt????01Xt??t??23t??,对该模型取一阶差分即可得
2t?1~??xy???x?
??x?xtttt212tt因此有
E(?)?E(?)??11~xE(?)???xt2tt1
这里未涉及到随机干扰项的序列相关性。 (2)由(1)知
??x1Var(?)?Var(?)?Var()?Var(?x?)?12?x??xt?
~ii122tti?? 故
??2Var()?2Cov(,?????xtxtxs2?tts?2?t?s??xt1由于Var(?)??, Cov(2t?t,?)??ss?t?2
Var(?)?1~?x?2?2t??2?xt2?22??xxt?sts?ts
34
??x?22t???xt2?2?22?22(??xtxt?1???t?1t?1n?1n?22xxtt?2?...???t?11n?1xxtt?n?1)
?n?12n?2xxn?1xx?xtxt?1tt?21n?????????...?? 22??222?t?1??xt?xt2?t?1?xt?xt?xt?2??n?2?n?1??22???xxtxt?1txt?222n?1xx1n? ??2??2??t?1??t?1?...??222???xt?xt2??xt?xt?xt??????的方差,第二项包含两个因素:随机干扰
?xx项?的自相关系数?和刻画X的序列相关性的。
?x上式中,右边第一项是无自相关时
?^1的OLS估计
1t?ststt2t如果 (a)??0,即
?xxt?sts?x2t?0,即?与Xt均存在正序列相关;??0,
t?xxt?sts?x2t?0
?t与
Xt均存在负序列相关,则
Var((b)??0,即
?)?Var(?)
11~^?xxt?sts?x2t?0,即?与Xt均存在正序列相关;??0,
t?xxt?sts?x2t?0
?t与
Xt均存在负序列相关,则
Var(?)?Var(?)
11~^3 解答
(1)在模型A中存在序列相关,但在模型B中没有序列相关 。
(2)自相关可能是由于模型A的无定义,因为它排除了二次趋势项。 (3)对于可能的函数形式,我们可能需要从经验知识来判断。 4 解答
一阶自相关指的是随机干扰项的当前值只与自身前一期值之间存在相关性。而DW方法仅适用于解释变量为非随机变量,随机干扰项的产生机制是一阶自相关,回归含有截距项,回归模型不把滞后被解释变量当做解释变量之一,没有缺失数据的情况。根据此定义,可以判断如下:(1)、(2)、
35