实验五 回归模型的OLS估计

2020-04-16 12:53

实验五 回归模型的OLS估计

【实验目的】

掌握一元线性、非线性回归模型的建模方法 【实验内容】

建立我国税收预测模型 【实验步骤】

【例1】建立我国税收预测模型。表1列出了我国1985-1998年间税收收入Y和国内生产总值(GDP)x的时间序列数据,请利用统计软件Eviews建立一元线性回归模型。

表1 我国税收与GDP统计资料

年份 1985 1986 1987 1988 1989 1990 1991 税收 2041 2091 2140 2391 2727 2822 2990 GDP 8964 10202 11963 14928 16909 18548 21618 年份 1992 1993 1994 1995 1996 1997 1998 税收 3297 4255 5127 6038 6910 8234 9263 GDP 26638 34634 46759 58478 67885 74463 79396 一、建立工作文件

⒈菜单方式

在录入和分析数据之前,应先创建一个工作文件(Workfile)。启动Eviews软件之后,在主菜单上依次点击File\\New\\Workfile(菜单选择方式如图1所示),将弹出一个对话框(如图2所示)。用户可以选择数据的时间频率(Frequency)、起始期和终止期。

图1 Eviews菜单方式创建工作文件示意图

1

图2 工作文件定义对话框

本例中选择时间频率为Annual(年度数据),在起始栏和终止栏分别输入相应的日期85和98。然后点击OK,在Eviews软件的主显示窗口将显示相应的工作文件窗口(如图3所示)。

图3 Eviews工作文件窗口

一个新建的工作文件窗口内只有2个对象(Object),分别为c(系数向量)和resid(残差)。它们当前的取值分别是0和NA(空值)。可以通过鼠标左键双击对象名打开该对象查看其数据,也可以用相同的方法查看工作文件窗口中其它对象的数值。

⒉命令方式

还可以用输入命令的方式建立工作文件。在Eviews软件的命令窗口中直接键入CREATE命令,其格式为:

CREATE 时间频率类型 起始期 终止期

本例应为:CREATE A 85 98 二、输入数据

在Eviews软件的命令窗口中键入数据输入/编辑命令:

DATA Y X

此时将显示一个数组窗口(如图4所示),即可以输入每个变量的数值

2

图4 Eviews数组窗口

三、图形分析

借助图形分析可以直观地观察经济变量的变动规律和相关关系,以便合理地确定模型的数学形式。

⒈趋势图分析

命令格式:PLOT 变量1 变量2 ……变量K

作用:⑴分析经济变量的发展变化趋势

⑵观察是否存在异常值

本例为:PLOT Y X

⒉相关图分析

命令格式:SCAT 变量1 变量2

作用:⑴观察变量之间的相关程度

⑵观察变量之间的相关类型,即为线性相关还是曲线相关,曲线相关时大致是哪种类型的曲线

说明:⑴SCAT命令中,第一个变量为横轴变量,一般取为解释变量;第二个变量为纵轴变量,一般取为被解释变量

⑵SCAT命令每次只能显示两个变量之间的相关图,若模型中含有多个解释变量,可以逐个进行分析

⑶通过改变图形的类型,可以将趋势图转变为相关图

本例为:SCAT Y X

图5 税收与GDP趋势图

图5、图6分别是我国税收与GDP时间序列趋势图和相关图分析结果。两变量趋势图

3

分析结果显示,我国税收收入与GDP二者存在差距逐渐增大的增长趋势。相关图分析显示,我国税收收入增长与GDP密切相关,二者为非线性的曲线相关关系。

图6 税收与GDP相关图

三、估计线性回归模型

在数组窗口中点击Proc\\Make Equation,6.0中是在quick/Equation Estimation如果不需要重新确定方程中的变量或调整样本区间,可以直接点击OK进行估计。也可以在Eviews主窗口中点击Quick\\Estimate Equation,在弹出的方程设定框(图7)内输入模型:

Y C X 或 Y?C(1)?C(2)?X

图7 方程设定对话框

还可以通过在Eviews命令窗口中键入LS命令来估计模型,其命令格式为:

LS 被解释变量 C 解释变量

LS y c x

系统将弹出一个窗口来显示有关估计结果(如图8所示)。因此,我国税收模型的估计式为:

??987.54?0.0946x y 4

这个估计结果表明,GDP每增长1亿元,我国税收收入将增加0.09646亿元。

图8 我国税收预测模型的输出结果

如果存在滞后项,则命令格式为:

1、存在一期滞后期 命令格式为: y y(-1) c x

2、存在多期滞后期 命令格式为: y y(-1) y(-2) y(-3) y(-4) c x 或者为: y y(-1 to -4) c x

上述命令中的变量,可以包含公式,公式中不应有空格或者应当用小括号括起来 LOG(Y) C LOG(Y(-1)) ((X+X(-1))/2)

标准回归模型输出结果解读:

标准误差(Std. Error):是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度。主要用来衡量回归系数的统计可靠性。

标准误差的理念原自一个事实:只要样本平均值是无偏估计值(unbiased estimator),误差(估量与真实数值的差)的标准差等于估量自身的标准差,因为随机变量和期望值之间差异的标准差等于一个随机变量自身的标准差。

在很多实际应用中,标准差的真正值通常是未知的。因此,标准误这个术语通常运用于代表这一未知量的估计。在这些情况下,需要清楚业已完成的和尝试去解决的标准误差仅仅可能是一个估量。然而,这通行上不太可能:人们可能往往采取更好的估量方法,而避免使用标准误,例如采用最大似然或更形式化的方法去测定置信区间。第一个众所周知的方法是在适当条件下可以采用学生t-分布为一个估量平均值提供置信区间。在其他情况下,标准差可以有效地利用于提供一个不确定性空间的示值,但其正式或半正式使用是提供置信区间或测试,并要求样本总量必须足够大。其总量大小取决于具体的数量分析

5

概率(Prob):显示在服从t分布条件下,对应相关t统计量值的概率。

可决系数(R-squared):测量的是在样本范围内用回归来预测被解释变量的好坏程度。

DW统计量:是对序列相关性进行检验的统计量。

F统计量:是对回归式中的所有系数均为0的假设检验。

统计学上的自由度(degree of freedom, df),是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数称为该统计量的自由度。

例如,在估计总体的平均数时,由于样本中的n个数都是相互独立的,从其中抽出任何一个数都不影响其他数据,所以自由度就是估计总体参数时独立数据的数目,而平均数是根据n个独立数据来估计的,因此自由度为n。

在估计总体的方差时,使用的是离差平方和。只要n-1个数的离差平方和确定了,方差也就确定了;因为在均值确定后,如果知道了其中n-1个数的值,第n个数的值也就确定了。这里,均值就相当于一个限制条件,由于加了这个限制条件,估计总体方差的自由度为n-1。

其次,统计模型的自由度等于可自由取值的自变量的个数。如在回归方程中,如果共有p个参数需要估计,则其中包括了p-1个自变量(与截距对应的自变量是常量1)。因此该回归方程的自由度为p-1。

一个例子:用刀剖柚子,在北极点沿经线方向割3刀,得6个角。这6个角可视为3对。6个角的平均角度一定是60度。其中半边3个角中,只会有2个可以自由选择,一旦2个数值确定第3个角也会唯一地确定。在总和已知的情况下,切分角的个数比能够自由切分的个数大1。

6


实验五 回归模型的OLS估计.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:人教版一年级下学期数学第6单元试卷《100以内的加法和减法一》试

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: