品质。
2. 3.11(1)(2)(3)
用练习2.13我国1978—1997财政收入Y与国民生产总值(GNP)X的统计数据,要求:先建立财政收入的一元线性模型的样本回归方程;
(1)利用DW统计量,偏相关系数PAC和BG检验,来检验模型序列相关性。
首先,要进行DW的检验。然后: 提示:a. PAC检验的滞后期长度p取10;
具体的操作:在方程窗口中点击
View\\Residual
Test\\Correlogram-Q-statistics,并输入滞后期为10后,输出图中有PAC(Partial Correlation)的直方块图或数值,当其绝对值大于0.5时,即认为存在某阶自相关性;也可以看黑色的直方块,例如,当第一个和第二个直方块超出左方或右方虚线位置(虚线位置表示正负0.5的位置)时,即认为存在某阶自相关性。
注意:如果直方块图没有超过虚线(可能不是正版软件的原因所造成的问题,因为软件是免费的。),而PAC的数值超过正负0.5时,则必须以PAC的数值为准,则认为直方图已经超过了虚线,即认为存在某阶自相关性。
b.BG检验中的滞后期长度p取2;
具体的操作:在方程窗口中点击Views\\Residual Test\\Serial Correlation LM Test,并选择滞后期为2,即可有输出结果表。表中的Obs*R-squared 即为
nR2,可以查临界值进行检验,或根据其后的临界概率值(p值检验)进行判断。
表中的RESIDI(-1)和RESID(-2)(代表一阶残差和二阶残差),也是解释变量,可以根据解释变量的显著性检验(即t检验,也可用p值检验)来判断是否存在一阶和二阶序列相关性。
(2)通过在LS命令中直接加入AR(1)和AR(2)两项,来检测模型的自相关性,并与第(1)步中的检验结果进行比较;
提示:
a. 在LS命令的后面加上AR(1)和AR(2)两项,就自动地可以使用迭代估计法估计模型。
11
b. 在结果输出表中,AR(1)和AR(2)右侧的两个数据就是?1和?2的估计值,可将其视作解释变量,就可以进行变量的显著性检验(t检验,也可用p值检验),若显著,则表明确实存在一阶和二阶序列相关性。
c. 对调整后建立的模型,请再次用DW,PAC和BG方法进行一轮检验,看模型是否还(仍然)存在自相关性。
(3)分析调整自相关性之后,原始模型的估计与调整后的模型之间结果的变化情况。
提示:a. 此处的分析,是指用调整后的模型的系数,参数估计量标准差,与原来的(没有调整前)的原始模型的系数和参数估计量标准差的情况进行比较后,谈谈你的分析和看法(参见教材的P98的最下端);
b. 在写出最后建立的调整后的模型时,不需要加AR(1)和AR(2)这两项。 3. 3.17
提示:a.“可能类型”是指根据相关系数的值的大小,来判断解释变量之间的多重共线性是高度的或中度的。如果数值大,即表明是高度相关的。
b.相关系数的检验表明,发电量X2与与钢铁产量的相关性最强,所以,就选X2作为最基本的模型。
c.最终确定的钢铁产量的模型函数中的解释变量是X2和X1。
4. 3.19
提示:设:t0.025?2.12,则,各个变量的系数的t检验都是显著的。 第三次作业满分为50分。
每一次(指每一章)的作业完成后(注意:是每一章的作业全部完成后!),请同学们在与老师约定的,交作业本的上课时间结束时,把作业本直接交给老师;或请学习委员或班长及时收集,并交给老师批改后返还。
请各位同学在你们的作业本上(封面或第一页上),写上(1)“计量经济学课程作业或练习”(把别的课程的作业,交来我这里批改的事件偶有发生!);(2)年级专业(例如:10金融);(3)姓名和(4)学号,尤其是学号不要漏掉!以
12
便老师能根据年级、专业和学号(因为现在大都是各年级、各专业的学生混班上课),找出学生在名单上的具体位置,登记学生作业的成绩。
注意:因为是混班上课,各班级同学之间可能不太熟悉。所以,在分发作业本时,一定要保证把每本作业本,都分发到每一个不同班级的同学们的手中,要体现出不同班级同学们之间的友爱;不要因为不太熟悉,就把作业本压在手里或扔在桌子上不管不问!!实在(或一时)分发不出的作业本,应该分发给此同学的同班同学代为转交,或返还到老师处。
重要提醒:任何学生不得到讲台上翻看老师的教学资料,尤其不能翻看“苏州大学(学生)课堂考核及成绩记载表”,因为成绩(平时和期中)都属于私人资料,任何学生都无权查看其他学生的分数。学生要查自己的成绩,应该来问老师,由老师查看后告知(或给老师发邮件,由老师回复邮件告知)。一旦有学生违反以上提醒,此学生将在班级上受到老师批评!。
七、成绩构成
三次作业的累积总分,满分为100分,并作为平时的成绩。 平时、期中和期末考试成绩的计算方法:
原来的情况,必修课的学生平时成绩按10%计入学期总成绩;选修课的学生平时成绩也按10%计入学期总成绩。
从这学期开始,所有的9个专业都是必修课,也都按10%计入学期总
成绩。
关于期中考试和期末考试的考分计算办法: (一)期中考试
A:上学期的情况,比较复杂:
原来我院的9个本科专业的计量经济学课程,有6个专业是必修课,3个专业是限选课。所以:
以必修课班为主班的有期中考试,卷面总分为100分,按20%计入学期总成绩。而,选此主班的必修课的学生和选修课的学生,就是与住班学生混班上课的,那么,这些选择混班上课的选修课和选修课的学生的成绩的计算,则一律都要按必修课班的计算方法进行计算,也即:必修课和选修课的学生都有期中考试,
13
卷面总分为100分,也按20%计入学期总成绩。
以选修课班为主班的没有期中考试。而,选此主班的必修课的学生和选修课的学生,就是与住班学生混班上课的,那么,这些选择混班上课的选修课和选修课的学生都没有期中考试。
B:从这学期开始,所有的9个本科专业都是必修课,都有期中考试!!!。卷面总分为100分,都按20%计入学期总成绩。
(二)期末考试
A:上学期的情况,比较复杂:
卷面总分为100分,以必修课班为主班的所有学生按70%计入学期总成绩;以选修课班为主班的所有学生按90%计入学期总成绩。
B:从这学期开始,所有的9个本科专业都按70%计入学期总成绩。
八、考试题型(及注意事项)
考试题型有:(一)概念阐述题(即名词解释)、(二)填空题、(三)选择题、(四)简述或简答题、(五)分析和说明、计算、数学证明和推导题等。
注意:学生在考试(期中和期末)开始答卷前,必须在考卷第一页最上部的有关栏目中,填写自己姓名、年级、学号和(考试的)日期,尤其是学号不要漏填!(什么都不填写的事件偶有发生!老师在改卷子的时候,根本就不知道是哪个学生做的卷子)。
另外,在考卷上的专业一栏中,烦请同学们用笔“勾出”或“圈出”你所在的专业的简写,以便老师按专业和名单的顺序,登记考试成绩,并排列出试卷。
简写对照如下:“财”(指财务管理专业)、“电”(指电子商务专业)、“会”(指会计学专业)、“C”(CGA:指会计学的国际会计专业方向)、“营”(指市场营销专业)、“经”(指经济学专业)、“工”(指工商管理专业)、“国”(指国际贸易专业)、“金”(指金融学专业)和“政”(指财政学专业)。
实例:专业 财电会营经工国,即指这张考卷用于7个专业的学生的考试。 同时,在考卷上的年级一栏中,烦请同学们用笔“勾出”或“圈出”你所年
14
级的简写,如10(即2010级),11(即2011级)等。
九、重要论述(注意在课程的学习过程中,逐渐地加深理解) 1.估计方法、估计量和估计值
这是一组非常基础、非常重要、又相互关联的关键概念,同学们要在本课程的学习过程中,逐步并不断地加深理解,真正搞懂,这对深刻理解和掌握数理统计和计量经济方法的本质具有十分重要的作用。
(1)估计量:为了估计真值?的估计值,从总体中抽取若干个容量为n的随机样本,所导出的样本值随机函数:??f(X1,X2,......,Xn,Y),?称为?的估计量。?是样本数据的随机函数,在多次抽样得到多个样本的情况下(多次抽样肯定是做得到的),用这个随机函数,可以计算出多个估计值的数值,这些估计值的一系列数值,形成的就是一个随机变量(参数估计量)。
重复一遍:在多次抽样(多个样本)的情况下,?是一个随机变量!!。 (2)在代入一个样本(注意:是一个样本)的具体数据(一次抽样获得的数据)后,估计量(公式)为我们提供了(计算出)参数真值?的一个估计值。十分清楚的是:有了估计量(的这个公式),才会有(计算出)一个估计值。即:估计值是某一个样本的数据代入估计量随机函数后,从估计量公式中所得到(计算出)的一个具体值,被称为真值?的一个估计值。
好的估计值取決于好的估计量;而好的估计量取決于好的估计方法。 (3)在数学描述上,?这个符号有两个含义:参数估计量和参数估计值。在估计公式(估计量的表达式)中,代入一个样本的具体数据后,就可以得到一个估计值。
在符号上,我们对估计量和估计值并不加以区别,但,两者在含义上是有显著区别的(一个是随机变量,另一个是一个具体的值),要特别加以注意。
估计量告诉了我们如何计算真值的估计值的一种理论的规则或一个具体的公式,而估计值则仅仅是用此公式计算出来的一个数值而已。
(4)参数估计量的评价标准:无偏性、有效性和一致性。
????? 15
计量经济学课程学习指导提要
任课教师:苏州大学商学院 李德光
编写:李德光 2013年2月版
(请同学们在收到此文件后,先立即浏览一遍,以便及时掌握有关的情况)
内容目录:
一、课程意义 (P2) 二、知识准备 (P2) 三、教材选择 (P4) 四、出勤出力 (P5) 五、软件选择 (P7) 六、作业布置 (P8) 七、成绩构成 (P13) 八、考试题型 (P14) 九、重要论述 (P14) 十、基本符号、有关符号和英文说明 (P17) 十一、有关论述 (P18) 十二、习题与案例示例 (P19) 十三、选择题示例 (P39) 十四、计量经济学基本英文词汇 (P43) 十五、任课老师简历 (P51)
1
一、课程意义
计量经济学,在欧美发达国家高校,被列为商学院商科各专业(我们商学院共有7个教学系,共计9个商科本科专业)学生(学士、硕士和博士)的少数几门核心课程之一。对计量经济学理论和方法的掌握和应用,已成为不同高校商科各专业的教研人员学术水平和学生之间学术水平、专业能力和实践能力的重要评价标准之一。
通过学习,学生可以全面掌握计量经济学的思想、理论、方法和应用,以及模型思想和方法,以及软件应用。可以非常有效地培养学生分析和解决实际问题的能力。同时,还可以全面提高学生对概率论和数理统计的理论和实践的素养,这一点,也是非常重要的。
因此,很好地掌握这门课程思想、理论、方法和应用,无论对于今后参加实际工作的学生的职业竞争力,还是对于要继续深造的学生,意义都是十分重要的。
近20年来,中国国内的与商科专业有关的学术期刊(尤其是高水平的权威及核心期刊),都普遍要求投稿的稿件具有计量经济学模型的实证分析(国外的学术刊物就更不用说了),否则,稿件(以往的稿件大都仅仅是文字性的定性的理论论述)将很难被录用,这也有力地反映了计量经济学课程地位的日益重要。
希望同学们对这门课程的学习给予一定的重视。
二、知识准备
相对来说,计量经济学是一门有一定难度的课程,课程涉及到经济学理论、微积分、概率论、数理统计、统计学、线性代数和矩阵,以及计算机的应用等多门课程。
在计量经济学的定义中,提到要依据“经济理论”和“实际统计资料”,这里的“经济理论”有两层含义:一是,计量经济学最早发端于对经济学问题的研究,所以建立经济模型要依据已经建立的经济理论;二是,在计量经济学建立并得到了长足的发展后,计量经济学的理论和方法不但用于经济学的研究,还全面应用于商科(商学院各专业)的研究。在美国等西方国家,计量经济学的理论和方法,甚至早就应用到农业和医疗保健,甚至林业、社会学、政治学、军事、国
2
防和国际政治学等广泛的研究领域。
所以,第一个“依据:经济理论”的第二层含义是:你工作所在的、研究的特定学术或专业领域,已经建立的这个领域的专业和学科的有关理论。
对此,同学们一定要建立起全面和深刻的理解:不是仅仅用于经济学!。 在以概率论为强大数理基础的数理统计(学)中,最基本和应用最广的分析方法是(传统)回归分析,在所有涉及数量分析的学科和专业都具有很强的通用性。而计量经济学正是对(传统)回归分析的进一步研究和发展而应用于各个学科和专业,所以,计量经济学又被成为“现代回归分析”。
为什么计量经济学能应用与如此广泛的研究领域,请同学们先记住这个问题!在随后的学习中,随着(1)确定性变量、(2)随机变量和(3)虚拟变量的引入,同学们就会体会到计量经济学在理论上和实际应用中的强大。
对我们商学院的学生来说,通过学习,就会知道:计量经济学的思想、理论、方法和应用技巧,适用于我们商学院商科各个专业的理论研究和实际分析,且十分有效,是全球商学院毕业生基本和必备的重要本领之一。
希望同学们结合本教材的内容,及时回顾和复习有关的知识。 相关知识提要:
概率论是计量经济学的重要数学方法基础之一。主要的概念有随机试验、总体、元素、样本、样本点、事件、随机现象、“频率稳定性”、概率、随机变量及其分布等等。随机变量,及其概率分布是概率论的最基本和最核心的概念。随机变量的引入,使我们能用各种数学方法来研究随机现象,使概率论的内容更加丰富多彩,应用更加广泛。
我们考察随机变量的变化情况,并掌握随机变量的变化规律(概率分布)和数字特征(数学期望,方差等)。大数定律和中心极限定理是概率论的重要定律。
在实际研究过程中,我们实际拥有的只有样本,但却要藉此获悉总体的信息,并获得对总体参数的判断,于是,就有了参数估计和假设检验(小概率事件原理是假设检验推断准则的基础,对于科学研究和生活判断都具有十分重要的意义,对其的理解要涉及三个方面)这两大分支所构成的数理统计的统计推断技术。
统计量是样本的随机函数,是对样本中信息的有效提炼和表征(在此基础上,才能有效地分析,并进一步把握事物的本质),是一个随机变量。这是数理统计
3
最基本和最重要的核心概念。在计量经济学中,我们要用到随机统计估计量和随机统计检验量。正态分布,?2,t,F分布是计量经济学的理论和实践中常用的主要分布,理论和实践作用十分重要,是计量经济估计和检验都要的重要的知识基础。其中的t分布在计量经济学中的应用最为广泛,使用频率也最高。随着自由度的增加,?2,t,F分布都将逐渐接近正态分布。
估计值是真值的估计,或真值的替代,而不是真值;真值是客观和真实存在的,但我们并不知道;如果我们知道,就不需要进行估计和检验了。因此,寻找真值的估计和真值的置信区间是我们的重要任务之一。
在各种以分布为基础的假设检验中,我们一般取5%为显著水平,这是我们在教学中一般选取的显著水平,也是理论和实际研究中较多选取的显著水平。但,我们有时也选取1%或(或两者之间的数值)作为显著水平。需要指出的是,显著水平的选取并无定规,要根据研究者所处的环境,以及对实际情况了解,风险程度的把握和分析者的态度而定。选取5%比较常见,也较为稳妥和恰当。
统计推断是计量经济学的主要理论支柱之一。其内容包括点估计和置信区间估计,以及根据?2,t,F这3种检验统计量(及其分布)进行的统计检验。
矩阵在计量经济学的研究中占有非常独特的地位,应用矩阵代数理论可以简洁、高效地表达、推导、分析和计算计量经济学的问题,尤其是对于多元线性模型的分析和研究。所以,计量经济学对矩阵代数有很大的依赖性。矩阵在许多数学分支,以及很多学科或领域都有广泛的应用。矩阵的定义和运算(加、减、乘、转置和逆)以及相应的性质,矩阵的秩(秩的概念和作用十分重要!)等。
三、教材选择
教材选用的是由上海财经大学出版社2010年出版的《计量经济学教程》的第二版。这本教材涵盖了教育部制定的,我国商学院各专业本科生计量经济学课程教学的基本要求的全部内容,课程体系较为完整。
教材在理论和实际操作的结合方面做得很好,第六章介绍了Eviews的主要内容和操作使用,可以方便学生很快掌握Eviews。教材的后面还有课程实验,可以方便地引导学生运用Eviews做练习。
4
第二章“回归模型”是全书以及计量经济学教学和研究的基础,是掌握计量经济学课程的基础及核心内容。在这一章中,要建立回归分析所涉及的许多基本概念及符号含义,重要的假定,重要的数量关系,以及基本的估计和检验的理论和方法等,并为后续各章的学习和研究,提供理论和方法的基础。
对这一章内容的仔细理解和透彻掌握,将使后续各章的学习变得很顺利。
教材中存在的一些小问题,在此更正如下:
(1)P6中,时间序列数据的定义改为:即按时间先后顺序排列的一个单位的数据。横截面数据的定义改为:即某一时点上的不同单位的数据。
(2)P11中的Brometrics改为Biometrics。
(3)P13中的第一行中的“这导致了对传统计量经济学的理论方法的质疑”改为“这导致了对传统计量经济学在少数应用领域的一些问题上应用效果的质疑”。
(4)P19中第四行,“只有了解了总体的整个概率分布情况”改为“只有了解了总体的所有数据和整个概率分布情况”。
(5)P27倒数第四行的“我国税收将增加”改为“我国税收将平均增加”。 (6)P29中,“二、 最小二乘估计的性质”改为“二、 最小二乘估计量的性质”。
(7)P32中,“(一)OLS估计的概率分布”改为“(一)OLS估计量的概率分布”。
(8)P32的?i~(0,?2)改为?i~N(0,?2)。
(9)P72的“(1)假定的含义及其违反的原因”改为“假定违反的含义及其产生的原因”。
(10)P84倒数第9行的RESI D中I与D之间的空格必须去掉。 (11)P41中间的?(y?y?ei)改为?(yi?y?ei)2。
2??(12)P7倒数第3行“模型参数估计量的稳定性”改为“模型参数估计值的稳定性”。
i(13)P23表2---3中最后一列的标题符号x2应为xi2。
5
四、出勤出力
本课程的思想、理论、方法和应用的知识,渗透在看教材、听课、记笔记、看“指导提要”、上机、做作业等多个相互促进的有机环节之中。所以,进行本课程学习的学生,应全面和认真地参与以上各环节的学习。
首先,要做到出勤,以保持学习的渐近性、连贯性和积累性,全面掌握所学的知识。教材、笔记和“指导提要”,三者相互补充,共同构成了一个完整的本科生计量经济学课程学习的教学材料体系。
其次,学习要出力,即要勤奋。努力学习,不断进步!
“一万年太久,只争朝夕!!”。
另外,阅读教材、笔记和“指导提要”时,要注意概念、符号、公式、原理、理论和方法、以及相互间的联系,以便加深理解,融会贯通,全面提高。
本课程的授课学时为57,每周3学时,3个学分。
由于本课程涉及较多的先导课程,又有一定的难度,内容也比较多,所以,本课程的学习,需要我们教学双方的相互配合和共同努力。谢谢大家!!
欢迎同学们对老师教学的各个方面提出批评和改进的意见,老师的邮箱:szldg@263.net 。
本学期老师任课的教室和授课时间如下: 周一上午的3---5节在文成楼325; 周二上午的3---5节在文成楼408; 周二下午的6---8节在文成楼123; 周三上午的3---5节在文成楼222。
本课程的教学内容和进度的安排大致如下(4个班保持一致):
第一章 教材上共有5节,教学时间为两周; 第一章 增加第6节“知识准备”,共分为3个小节:
第一小节 概率论; 第二小节 统计推断;
6
第三小节 矩阵代数; 教学时间为三周。
第二章 教材上共有4节,教学时间为六周左右; 第三章 教材上共有6节,教学时间为六周左右。 总教学时间为19周。
五、软件选择
本课程使用的软件,是目前流行和广泛使用的Eviews,请同学从网上下载,3.1及以上版本都可以使用。建议选用目前国内较为普及的经典的3.1版本,这个版本稳定性较好,问题少,比较好用,完全可以满足商学院商科各专业的本科生和研究生计量经济学课程教学和研究的需要。
由于是网上下载的免费软件,所以,所发布的版本较低,可用性和可靠性就可能较高。而免费的高版本,存在的问题可能反而会较多,容易出问题,不好用。
熟练地掌握软件的使用方法,是本课程重要的教学目标之一。请同学们在上机操作的过程中,认真阅读教材的第六章,教材后面的课程实验,以及老师编的“指导提要”中的有关上机操作的内容,并在用软件做习题的过程中,加深对课程内容的理解。
课后的作业大都要使用Eviews完成。在使用Eviews软件时,要注意以下几点经常遇到的细节问题:
(1)在输入一条命令后,一定要执行(回车)后;再输入下一条命令,再执行。否则,将出现错误,或无法运行,或没有出现合理的计算结果。因为前一条命令执行后的结果,要为下一条命令的执行提供逻辑基础和运算数据。
即:要逐条执行命令。切记!!
(2)在用DATA命令输入完数据后,要把光标从最后一个数据的尾部处移开,否则,可能会出现运算结果的错误。
(3)在一条命令中,不能有多余的空格,否则将会出现错误。
例如,输入一条命令中的REDI D时,I和D之间多出一个空格,会导致软件运行的问题或错误的结果。
(4)在怀特检验中,有交叉项(cross term)和非交叉项(no cross term)
7
的选择。一般情况下,为保证自由度不致减少,可选择非交叉项。
(5)在需要用到残差数据的上机练习中,一定要建立原始模型!! 因为只有在用LS命令对样本数据进行回归,并建立原始模型之后,计算机里才能储存有根据所建立的原始模型所计算出来的残差数据。只有具有了这些残差数据,你才能使用这些数据,并进行后续的各种分析和计算。切记!!
(6)由于现在的计算机的软硬件都很好,所以,练习的运算过程可以由软件的运行而很快地完成。因此,上机的主要工作是输入数据(心要细,以免输错数据),以及对整个方法体系运算过程的通盘构架,和实施过程的实现(脑子要清楚,以免思路混乱)。所以,同学们要保持思路的清晰,以便驾驭分析和运算的全过程。此外,在运算开始前,一定要保证输入数据的正确,输入数据后,最好再检查一遍。
六、作业布置
第一次(第一章)作业:1.1.2 2.1.3 3.1.4 4.1.5 。 第一次作业满分为20分。
第二次(第二章)作业:1.2.13
(1)提示:可在作业本上列出“输出表”中的有关栏目和数据,然后,把样本回归方程直接写在作业本上即可。
所谓的“斜率系数经济意义(含义)的解释”,就是:解释变量变动一个单位,被解释变量平均增加或减少的数量(就是斜率系数的数值。斜率系数为正号表示增加,负号表示减少)。
(2)只要将X=78107.8代入所建立的样本回归方程,就可以计算出1998年财政收入的预测值。
2.2.14的(1)和(2)。
提示:在本题的(2)中,有几个重要的问题要注意: (1)要进行判定系数R2的检验;
(2)重新估计模型后,还需要进行检验。要记住:估计和检验,是计量经济学研究中非常自然、和非常连贯两个步骤(第二和第三步)。
8
(3)同时,还要注意:在剔除了多余的解释变量后,模型中解释变量的个数已经发生变化;相应地,自由度也会发生变化,并导致检验过程的一些变化。
(4)F和t检验需要进行两种:临界值检验法和p值检验法。 3.2.15
注意:要进行判定系数的检验;F和t检验需要进行两种:临界值检验法和p值检验法。
第二次作业满分为30分。
第三次(第三章)作业:
1.3.8 要求:(1)根据Y,X的相关图分析是否存在异方差;如果存在,则要判断异方差的可能类型(递增型,递减型,或复杂型)。
提示:输入数据后,可用SCAT X Y命令产生图形,并对图形中点的分布情况进行分析、判断和说明。
(2)利用怀特检验,帕克检验和戈里瑟检验进行异方差性的检验; 提示:h的值一般取6个(h??1,?2,?1/2),所以戈里瑟检验一般(一定要!)要进行6次。
(3)利用WLS方法估计利润函数。 提示:a.一共要构造4个权数:
b.从帕克检验的模型中产生一个,用帕克检验的模型中右端变量X的表达式的倒数作为一个WLS的权数。例如,若变量表达的形式是x1.6,则选权数为1/x1.6(为什么是倒数?请同学们想一想其中的道理!参见教材P83的“趋势的反向变动”);
权数的产生命令为 GENR: GENR W1=1/X^1.6 (w1?1/x1.6) c. 从戈里瑟检验的模型中产生一个,戈里瑟检验要进行6次,并从中选出p值最小的一个方程(也是F值最大的一个方程,为什么?!),用这个p值最小的方程中右端变量X的表达式的倒数作为一个WLS的权数。例如,若变量表达的形式是X,则选权数为1/X(为什么是倒数?请同学们也想一想其中的道理!参见教材P83的“趋势的反向变动”);
9
权数的产生命令为 GENR: GENR W1=1/X (w2?1/x)
d.另外两个权数是w3?1/e和w4?1/e2,这两个权数是直接选取的(为什么直接选取这两个数学形式的权数?请同学们想一想其中的道理!参见教材P83的“趋势的反向变动”)。
权数的产生命令为 GENR:
GENR W3=1/ABS(RESID) (w3?1/e); GENR W4=1/RESID^2 (w4?1/e2);
建立模型的命令方式:LS(W=权数变量) Y C X
或LS(W=Wi) Y C X 或在方程窗口中点击Estimate\\Options按钮,并在权数变量栏依次输入4个权数。
e.要从用WLS方法建立的4个模型中,挑选出一个最好的作为最终的模型。 选择的准则是:
首先,进行第一步,要用怀特检验对用WLS所建立的4个模型进行检验,挑出那些不存在异方差(即已经消除异方差)的模型。注意:这个分析过程要用怀特检验来完成(参见教材的P85);
然后,进行第二步,从第一步过程中已经挑出来的这些模型中,再找出一个
R2值最大的模型,即为最终的最佳模型。
(4)比较和分析原始模型的估计与WLS估计的模型之间结果的变化情况。 提示:此处的分析,是指用WLS估计的模型的系数,参数估计量标准差,与原始模型(OLS估计)的系数和参数估计量标准差的等情况进行比较后,谈谈你的分析和看法(参见教材的P85的内容)。原始的模型其实是不能用的(因为不满足基本假定,所以,OLS估计的过程是存在异方差的,其估计量不是BLUE),或可形象地称模型是“病态的”;而用WLS估计的模型,估计的过程引进消除了异方差,所以,WLS得到的估计量是BLUE,或可形象地称模型是“健康的”。
本题说明:第三章的练习的工作量大大增加,因为在解决比较复杂的问题时,大量的工作、反复和周折都是免不了的,所以,在做练习和今后的实际工作中,同学们对此要有充分的认识和准备,并逐步培养出耐心和坚韧的心里素质和优良
10
本教材采用的OLS方法(在满足基本假定的情况下)是一个好的估计方法(上课时,会给出证明),得出的估计量是好的估计量(线性性、无偏性和有效性),因此,用这种OLS估计量得出(计算出)的估计值是一个好的(即接近真值的、比较准确的)估计值。
以上,就是三个概念的各自内涵和特征,以及相互之间的关系。
(5)参数的估计和假设的(统计)检验,是围绕随机统计估计量和随机统计检验量的分析而展开的。因此,对这两个统计量,要予以特别的关注和深入的理解。围绕统计量展开分析和研究(估计和检验)是数理统计学和计量经济学的显著特征,是所有科学研究的根本和通用的方法。
在大学教育中(除了大学的纯文科专业),对统计量的深刻理解和熟练运用,在数量分析的过程中,居于最核心的地位。
2.多重共线性包括完全的多重共线性,和不完全(接近的或较强的)的多重共线性两种,两者在理论含义上有很大的区别。
对于不完全的多重共线性,OLS方法在理论上仍然成立,OLS估计量仍为BLUE。在实际的分析和应用过程中,我们所说的,和要处理的多重共线性,实际上就是指这种不完全的多重共线性。
关于完全的多重共线性的理论状况,将在上课时进行讲解。
3.计量经济学注重定量分析(主要采用模型方法),但,并不忽视定性因素的影响。为了表达和研究定性因素的作用,计量经济学在模型中引入了虚拟变量D。D的引入,使计量经济模型的形式、内容和应用都得到了相当程度的丰富,进一步增强了计量经济模型的实用性和准确性。
4.古典的回归分析,仅仅能解决满足基本假定的一些实际问题,而计量经济学不但可以解决满足基本假定的实际问题,还能解决不满足基本假定的实际问题。再加上,计量经济学在计量经济模型中,引入了极为重要和贴近现实的随机误差项?i,以及富于表现力的虚拟变量D,这就使得计量经济学模型的分析和预测很准确,方法价值很高,应用很广,被称为现代回归分析;并被西方国家的商科各专业界称为商科理论和实践研究、以及模型分析方法的“主流学科”。
5.P35和P37的系数的置信区间,是指各个解释变量的系数的真值将以95%的概率出现在这个估计的置信区间内,区间的大小衡量的是系数的估计值与系数
16
的真值的远近,也就是衡量系数估计值的准确性。
而:在第二章第三节的“六、预测”中的区间预测(在笔记里),是指被解释变量的可能的(!)准确预测值将以95%的概率出现在这个预测的置信区间内。
两种区间很容易混淆,但两者的含义是截然不同的,要加以注意!。
十、基本符号、有关符号和英文说明
1. m表示随机试验中结果的个数,也就是事件的数目。
2. N表示总体中的元素(单位)的个数,即总体元素(单位)数目。 同时,N还表示正态分布(normal distribution)。
3. E( )表示期望或均值, D( )表示方差,Cov( )表示协方差。 4. n表示样本点(数据组)的个数,即样本容量(sample size)。observations,观察次数,即样本点的个数,也即:英文缩写obs也表示样本容量n。
i?1,2,......n)5. (X1i,X2i,......Xki,Yi)表示样本数据,共有n组(n个样本点,。
6. k表示模型中解释变量的个数。
7. 随机误差项一般用?i来表示;(有的教材和书籍)也有(可以)用?i来表示随机误差项。
8.GENR是生成新的数据序列的命令,是Generate(发生、生成的意思),请参见教材P296。
9.在EViews的命令中,LOG实际上是指自然对数ln,参见教材P297。 ABS指的是绝对值函数,参见教材P297。
10.P98例4中的iteration,是“迭代”,“循环”的意思。
11.R-squared: 即判定系数R2;Adjusted R-squared:即调整的判定系数
R2。
12. Sum squared resid: 指残差平方和,即RSS或?ei2。 13. Durbin-Watson stat:即德宾—沃森统计量计算值。
14. Mean dependent var:即被解释变量的样本均值; S.D. dependent var:即被解释变量的样本标准差。
15. S.E. of regression:即回归模型的标准差的估计值?;也就是随机误差
17
?项?i的标准差的估计值?。
16. Std. Error : 即标准误差,也可简称为标准差。
17. S.D. (Standard Deviation):即标准差(要注意:Std. Error与Standard Deviation在含义上的区别!!)。
十一、有关论述
1.经济理论侧重于提出命题和假说,多以定性描述为主,而无数量的或数学的,特别是没有随机性的数量描述和研究。这是许多经济理论被质疑,导致经济学的可信度大大下降,并无法很好地应用于实践的主要原因之一,尤其在随机性日益普遍和加大的当今时代。
而考虑随机因素影响的计量经济学有效的解决了这一问题。计量经济学的出现,大大增加了经济学的可信度。为商科各专业的理论和实践研究提供了强有力的模型分析方法,巩固并提高了商科的理论和实践在现代经济社会的重要地位。
2.伟大的科学家冯﹒诺伊曼(Von Neumann)说:“科学的目的不只是解释现象,科学的主要任务是建立模型”。由此可见模型的重要性!
模型不但是科学研究的主要方法,也是知识表述和传递的主要方式,更是新知识“生产”的主要方法。模型思想是大学教育(除了大学的纯文科专业)的最重要的思想。不借助模型,将很难认识现在复杂的科学和社会现象,以及期中存在的规律,也就很难获得科学和社会的进步和发展。
计量经济模型概括并表达了与所研究系统的相关(各个商科专业的)理论,是理论用于实证研究的最有力和最方便的方式。
计量经济方法及应用,都围绕建立和运用各种计量经济模型这样一个中心。人们通过建立和运用各种各样的模型,来揭示和阐明自然现象与社会经济现象的本质和规律,从而极大地提高实践活动的前瞻性和成功可能。
3.1969年,首届诺贝尔经济学奖授予计量经济学家费里希和丁伯根(都是计量经济学家),高度评价他们“开发了经济分析过程的动态模型,并使之实用化”。
4. 随机关系的重要现实意义及其在计量经济学中的重要地位。
除了影响经济过程的各种随机因素外,对模型的合理的必然简化也会带来随机性。
18
?对于某一种经济管理现象或问题而言,其往往受到很多因素的影响,而人们在认识事物的过程中,由于种种原因,常常只能选择一种或若干种主要因素进行研究。这样,就会有一些因素未被选上,这些未被选上的因素必然也会影响所研究的问题。因此,由被选因素所构成的数学模型,与由全部因素所构成的数学模型(很难做到),同时去描述同一经济现象,两者之间必然会有一些出入。
因此,为了使模型更加确切地说明客观现象,就有必要引入随机误差项?i,来反映那些未被选上的因素,以及随机性因素的影响。
?i的内容十分丰富,是计量经济学的本质特征和重点研究内容。?i的引入,
使计量经济模型的准确性大大增加,使计量经济学得到广泛应用。
近60年,随着经济活动频度的迅速加快,以及地域间经济互动的日益密切(市场经济和国际贸易),再加上通讯技术,尤其是互联网技术的快速发展,信息传递和交换速度大大加快,这导致了管理、经济、和商业活动的相互干扰日益加大,从而使经济和管理活动在21世纪初以来,呈现出更加明显和更加普遍的随机性状况,这也使得计量经济学在21世纪的理论的正确性和应用广泛性更加突出,地位愈加重要。
总之,经济活动本身固有的随机性、自然灾害、公共事件、信息技术的发展、不同文明间的冲突、人类本性和行为固有的随机性等等,都会对经济活动和管理过程产生很大的随机性干扰和影响。对此,我们应该有十分充分的认识。
十二、习题与案例示例
1.假定有如下的回归结果:yi?2.69?0.48xi其中,Y表示美国的咖啡的消费量(某天的个人消费的咖啡杯数),X表示咖啡的零售价格(美元/杯)。回答:
(1)这是一个时间序列数据回归,还是横截面数据回归? (2)如何解释截距的意义,它有经济含义吗? (3)如何解释斜率的经济意义?-0.48是真值吗? (4)能否求出真实的总体回归方程?为什么?
解答:(1)这是一个横截面数据回归。因为是某一天的各人的样本数据 (2)截距2.69表示咖啡零售价在t时刻为每杯0美元时,美国平均消费量
? 19
为每天每人2.69杯,这个数字没有什么实际的经济意义(说明:常数项或截距项是在建模的过程中,所形成的一种数学状态,有时有一定的经济意义,但在大部分情况下,是没有什么具体的经济意义的,如果其不可解释,或你不作解释,也没有什么关系);
(3)斜率(估计值)-0.48表示消费量与咖啡零售价之间的负相关关系,价格每上升1美元/杯,则每天每人消费量平均减少0.48杯,此即斜率(系数)经济意义的解释;
(说明:在多元线性回归模型中,某个解释变量的系数的经济意义是指,当其他的解释变量不发生变化时,这个解释变量变化一个单位,所引起的Y的上升或下降的平均变动幅度);
-0.48仅仅是参数估计量分布上的一个具体的估计值(一个点),不是参数的真值,所以-0.48是估计值,而不是真值(等于真值的概率几乎等于零;但是,我们还不能说就一定是零)。
(4)不能;因为我们获得的是样本数据,我们可能无法(也没有必要)获得美国所有消费者咖啡消费量及价格的全部数据,以及概率分布情况。所以,不能(也没有必要)求出总体回归方程。
2.已知回归模型E????N??i,式中E为某类公司一名新员工的起始薪金(元),N为所受教育水平(年)。随机扰动项?i的分布未知,其他所有的基本假定都满足。问:
(1)从直观及经济角度解释?和?。
?满足线性性、无偏性及有效性吗?简单陈述理由。 ?和?(2)OLS估计量?解答:(1)???N为接受过N年教育的员工的总体平均起始薪金。当N为零时,平均薪金为?,因此,此处的?表示没有接受过教育员工的平均起始薪金。
?是N每个单位变化(一年)所引起的E的变化,即表示每多接受一年学校教育,所对应的薪金增加值。从经济和实际情况看,两个参数都应该是正值。
?满足线性性、无偏性和有效性,因为这些BLUE?和仍?(2)OLS估计量? 20
性质的成立只需满足基本假定,而无需随机扰动项?i服从正态分布的假定。
3. 对没有截距项的一元回归模型,Yi??1Xi??i,称之为过原点回归。试证明:(1)如果通过相应的样本回归模型可得到通常的的正规方程:
?eXii???XY??0,可得?1的估计值:??ii1??X?;
2i?为无偏估计量; (2)在基本假设E(?i)?0下,?1?是?的OLS估计量。 (3)只有?11?X)?0得 解答:(1)由正规方程?Xi(Yi??1i
?XYii22????1?Xi 求解得 ?1?(?XiYi)/(?Xi)
??(XY)/(X2),求期望:E(??)?E(XY/X2) (2)对于??ii?i?ii?i11?(
11)E(XY)?()E[Xi(?1Xi??i)]ii2?2??Xi?Xi112)?(X)?()XiE(?i)??11?i22?XX?i?i
?(?X)2 (3)OLS方法要求残差平方和最小:Min RSS??ei2??(Yi??1i?X)(?X)?0,即?求偏导得: ?RSS?2?(Y???X)?0 关于?Xi(Yi??i1ii?11i???1???XY???ii1
??X? 可见只有??是OLS估计量。
2i14. 表1是以进出车站的乘客为主要服务对象的10家便利店的数据。y是日均销售额,x1是店铺面积,x2是作为选址条件的店铺距车站的距离。
表1 日均销售额、店铺面积和店铺距车站的距离的数据
店铺 日均销售额(万元)店铺面积(平方米)x1 店铺距车站的距离(100米)x2 y A B 40 45 60 100 3 5 21
C D E F G H I J 80 60 50 20 15 90 30 70 85 50 75 55 70 95 45 65 2 1 3 4 6 1 3 2 Eviwes运行结果见下表:
Dependent Variable: Y Method: Least Squares Date: 04/22/06 Time: 15:28 Sample: 1901 1910 Included observations: 10
Variable C X1 X2
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
Coefficient 36.41214 0.754585 -13.07769
Std. Error 8.171938 0.105887 1.213087
t-Statistic 4.455753 7.126326 -10.78050
Prob. 0.0030 0.0002 0.0000
0.956605 Mean dependent var 50.00000 0.944206 S.D. dependent var 5.918273 Akaike info criterion 245.1817 Schwarz criterion -30.18646 F-statistic 1.809788 Prob(F-statistic)
25.05549 6.637292 6.728067 77.15446 0.000017
要求:(1)根据Eviwes运行结果,写出多元回归模型y??0??1x1??2x2??的样本回归方程;
(2)写出判定系数R2和调整的判定系数R2;
(3)假设其他条件不变,店铺面积增加1平方米,日均销售额能增加多少
22
元?
(4)假设其他条件不变,店铺距车站的距离比现在远100米,日均销售额会减少多少元?
(5)假设有人想新建一个店铺K店,计划店铺面积为80平方米,距车站
?300米,试预测其日均销售额yK。
解答:(1)根据Eviwes运行结果,可知样本回归方程为:
??36.412?0.7546x1?13.078x2 y(2)判定系数R2为0.956605和调整的判定系数R2为0.944206。 (3)假设其他条件不变,店铺面积增加1平方米,日均销售额能增加7546元。
(4)假设其他条件不变,店铺距车站的距离比现在远100米,日均销售额会减少130776.9元。
(5)假设有人想新建一个店铺K店,计划店铺面积为80平方米,距车站
?300米,试预测其日均销售额yK为:
36.41241?0.754585?80?13.07769?3?57.576444(万元)。
5. 求多元模型系数bi的最小二乘估计(值)时,是否需要多元线性模型的假定4作为条件?
解答:对系数bi的最小二乘估计时,需要多元线性模型的假设4作为条件。 由B?(X/X)?1X/Y可知,有关矩阵X的假定:X是k?1列确定的(非随机性)数值矩阵,rank(X)?rank(X/X)?k?1?n这一需要满足,此时参数bi的估计值有且仅有唯一解。
若rank(X)?rank(X/X)?k?1,即X'X为奇异阵,X/X?0;(X/X)?1不存在(即:不可求),则B?(X/X)?1X/Y无法计算,所以,不能得到各参数的估计值。这时,解释变量之间将存在完全的多重共线性。(回答完毕)。
进一步的讨论:
23
??所以,在多元模型中,如果满足了假定4,就可以进行参数的估计了,但,如果不满足其它假定,则不能保证是BLUE,也即,估计值是不准的,是不靠近真值的,但可以实现估计的过程。只有满足了全部的4个假定,才能使参数估计量为BLUE。
而在一元模型的估计中,如果不满足4个假定,也能进行最小二乘法的估计,但参数估计量不是BLUE,也即,估计值是不准的,是不靠近真值的。只有满足了全部的4个假定,才能使参数估计量为BLUE。
一元或多元模型是否满足4个基本假定,可以从数据状况分析,实际情况分析,理论和机制分析等几方面加以综合研究,并得出相应的判断。
6. 某二元线性回归模型,有关的数据如下表:(此例较为完整地展示了多元线性回归模型的方方面面,比较典型,注意对照课堂上学习的内容,注意每一个矩阵及其所含各元素的意义,还要注意每一个矩阵的行列下标的数目及变化)。
1 2 3 4 5 要求: (1)写出Y,X;
(2)计算回归参数的估计值并写出模型; (3)计算样本判定系数R2和调整判定系数R; (4)计算检验统计量F值。
(5)计算?2和各参数估计量的标准差。
?3??1?1??1???解答:(1)Y??8?,X??1???3???1???5???1
?Y 3 1 8 3 5 X1 3 1 5 2 4 X2 5 4 6 4 6 235?14??56?
?24?46??24
?20??51525??,X/X??155581?, 76(2)X/Y?????????109???2581129??(X/X)?1?26.74.5?8.0??4.0???,B?(X/X)?1X/Y??2.5? ??4.51.0?1.5????????8.0?1.52.5????1.5??估计出库存费用的样本回归方程为:
y?4.0?2.5x1?1.5x2
?ESSB/X/Y?nY2(3)R???0.9464 2/TSSYY?nY2n?1R?1?(1?R2)?0.8929
n?k?1??2(4)F?BXY?nY/kY/Y?bX/Y/n?k?1?///2?17.6667
YY?B/X/Y?0.75 (5)??n?k?1?2/?(教材中有以上4个公式的非矩阵形式的计算公式)
??0.75?0.8660,S(b0)??C11?0.866026.7?4.4749
S(b1)??C22?0.86601?0.8660,S(b2)??C33?0.86602.5?1.3693
???????
判定系数R2和调整的判定系数R2的相互关系公式为:
R?1?(1?R2)2n?1
n?k?1判定系数R2的值要比调整的判定系数R2的值大。
k增加,?ei2减小(严格地说,不会增大只可能减小),R2增加(只可能增
加,不会减小)。k?0,则R2?R2,当k增加时,R2与R2之间的差距增加,R2有可能为负值,这与R2不同,因为0?R2?1。当k保持不变,而n增加,则R2 25
将变大。
7. 对下列模型:Yi????Xi?2Zi?ui (1)
Yi????Xi??Zi?ui (2)
求β的最小二乘估计值。
解答:将模型(1)改写成(Yi?2Zi)????Xi?ui,则?的估计值为:
????(Xi?X)(Yi?2Zi?Y?2Z)?(Xi?X)2
将模型(2)改写成Yi????(Xi?Zi)?ui,则?的估计值为:
????(X?Z?X?Z)(Y?Y)
?(X?Z?X?Z)ii2ii此例表明:我们可以对模型中的变量进行变量变换。
这种代换不但可以对线性变量进行形式变换,而且可以将非线性变量变为线性变量,从而把可线性化的非线性模型变换为线性模型。而非线性的参数却很难变为线性参数,所以模型的参数非线性问题是很难处理的。
为什么计量经济学模型大都采用线性函数?
解答:第一,现实中的经济问题有一部分确实是线性的;第二,有一些非线性的经济问题在用线性模型表示(替代)后,误差不大,所以,完全可以采用线性模型进行替代;第三,很多非线性问题,通过变量的变换,都可以转化为线性模型。所以,计量经济学主要采用线性函数是有可靠的现实依据的。
8. 设有两个消费函数的计量经济模型
(a) Y?137.47?0.773X(5.87)(10.65)R2?0.86??
n?25(b) Y?254.27?0.216X(4.372)(?2.54)R2?0.89
n?2026
其中:Y表人均消费支出,X表人均可支配收入,括号中数值为t统计量的计算值。
要求:(1)选择你认为合理的模型,并说明你的理由。
(2)对你选择的模型,给出斜率的经济意义解释(单位为美元)。 解答:(1)合理的应模型为(a),原因是边际消费倾向(X的系数)不可能为负值,这样,才符合理论预期。
因为,经济意义检验是第一位的,是首要的。在经济意义合理的情况下(经济意义检验通过后),再对不同模型的统计检验指标进行比较。
(2)当人均可支配收入增加1美元时,人均消费支出平均增加0.773美元。
比较和选择模型的一般程序是:
(1)考察参数估计值(变量系数)的经济意义,即,进行经济检验,这是首先要做的,是第一位的;(2)第二步,在各模型的经济检验都通过的情况下,再考察各模型的解释变量是否通过了t检验;(3)第三步,在(1)(2)步都通过的情况下,再看哪个模型的判定系数的值最大,就选哪个模型为合理(理想、最佳或最终)的模型。
9.观察下列方程并判断其变量和系数是否呈线性?进一步的问题:哪些模型可转化为线性模型?哪些不能?哪些本身就是线性模型?
(1)Yi??0??1Xi3??i (2)Yi??0??1(?2Xi)??i (3)Yi??0??i (4)Yi??0??1X1i??2X2i10??i ?1Xi解答:(1)变量非线性、系数线性;(2)变量线性、系数非线性; (3)变量、系数均为非线性;(4)变量、系数均为线性.
(1)可进行变量线性化,可转化为线性模型;(2)(3)参数无法线性化,无法转化为线性模型(4)本身就是线性模型。(关于计量经济模型结构的线性的特点或定义请参见教材P51)。
27
10. lnY?0.47?0.32lnX,X为企业销售收入,Y为研发支出(R&D),问:X增加1%和10%,Y增加的比例?
解答:0.32×1%=0.32%,;0.32×10%=3.2%。
11. 考虑如下两个回归方程(根据1946—1975年的美国数据)(括号中给出的是标准差):Ct?26.19?0.624GNPDt t?0.4398(2.73)(0.0060) (0.0736) se:R2=0.999
?1?C??D? ?25.92?0.6246?0.4315????GNPGNPGNP??t??tt(0.0597) se: (2.22) (0.0068)R2=0.875
式中,C为总私人消费支出;GNP为国民生产总值;D为国防支出;t为时间。 研究的目的是确定国防支出对经济中其他支出的影响。
(1)将第一个方程变换为第二个方程的原因是什么?
(2)如果变换的目的是为了消除或者减弱异方差,那么我们对误差项要做哪些假设?
(3)如果存在异方差,是否已成功地消除异方差?请说明原因。 (4)变换后的回归方程是否一定要通过原点?为什么? (5)能否将两个回归方程中的R2加以比较?为什么? 解答:(1)原因有二:
第一,将被解释变量和解释变量均转换为支出与GNP的比值,可以表示出该项支出在国民生产总值中的比重,这更加强了模型对于经济现象的解释作用。
第二,有可能是因为该模型中出现了异方差的现象,转换方程是想变异方差为同方差,为了使估计结果为BLUE估计量。
2(2)误差项?i的期望为零,方差为GNPi,即
2E??i??0,var??i??GNPi
(3)基于(2)的假设,通过这样的转换,转换后模型的随机误差项?i*已具有如下特点:
28
??i? E??i*??E??GNP???0
i??ri*??E?? va??*2i???i?12????E??E??1 i2?GNP?GNiPi??2这样的误差项已符合使用OLS获得良好估计的假定,可以说是已消除了异方差。
(4)变换后的回归模型是不一定通过原点的。
?D??C?在本例中,变换后的模型解释变量为?,被解释变量为,而???GNPGNP??t??t1这一项近似地等于零,可以忽略不计。因此,模型中还有一个正截距,不GNPt会通过原点。
(5)不能单纯地用R2的值对两个回归方程进行比较。
虽然,R2值表示的是解释变量对被解释变量的解释程度的大小,R2越接近1,表示模型的解释能力越强。但是,在本例中,由于原始模型中的误差项具有异方差性质,这时R2值的大小是受到怀疑的,因为有可能是异方差的存在,影响了模型的R2值。所以转换前后模型的R2孰小孰大,并不能据此判断两个模型的解释能力孰弱孰强,需要进行更深入和具体的分析。
12.在研究生产函数时,得到以下两种结果:
?t=-5.04 + 0.8871nKt + 0.8931nLt (A) 1nY S.E.= (1.40) (0.087) (0.137) R2=0.878 n=21
?t=-8.57 + 0.0272t + 0.4601nKt + 1.2851nLt (B) 1nYS.E.= (2.99) (0.020) (0.333) (0.324) R2=0.889 n=21
其中,Y=产量,K=资本,L=劳动,t=时间,n=样本容量。
请回答:
(1) 验证模型(A)中所有的系数在统计上都是显著的(5%); (2) 验证模型(B)中t和lnK的系数在统计上不显著(5%); (3) 可能什么原因造成了(B)中lnK的系数不显著;
29
(4) 如果t与lnK的相关系数为0.98,你将如何判断并能得出什么结论? 解答: (1) 模型(A)中三个系数对应的t统计量分别为:
?5.040.8870.893=-3.6 =10.195 =6.5182 1.400.0870.137查t分布临界值表得t0.025(18)=2.101,模型(A)中三个系数t统计量的绝对值均大于临界值2.101,因此所有的回归系数在统计上都是显著的。
(2) 模型(B)中t和lnK的系数对应的t统计量分别为:
0.02720.460=1.36 =1.38
0.02000.333查t分布临界值表得t0.025(17)=2.11,模型(B)中t和lnK的系数对应的t统计量绝对值均小于临界值2.11,因此回归系数在统计上不显著。
(3) 造成模型(B)中lnK系数不显著的原因是由于新变量t的引入,t与lnK之间可能存在严重的多重共线性。
(4) t与lnK的相关系数为0.98,表明两者相关程度很高,模型(2)存在严重的多重共线性。
13.某地区供水部门利用最近15年的用水年度数据得出如下估计模型:
?=-326.9 + 0.305HO + 0.363PO – 0.005RE – 17.87PR – 1.123RA W (-1.7) (0.9) (1.4) (-0.6) (-1.2) (-0.8)
R2=0.939 F=38.9
其中,W(Water)—用水总量(百万立方米),HO(House)—住户总数(千户),PO(Population)—总人口(千人),RE(Revenue)—人均收人(元),PR(price)—价格(元/100立方米),RA(rain)—降雨量(毫米)。
(1) 根据经济理论和直觉,预计回归系数的符号是什么(不包括常量)? 为什么? 观察符号与你的直觉相符吗?
(2) 在10%的显著性水平下,请进行变量的t检验与方程的F检验。t检验与F检验结果有相矛盾的现象吗?
(3) 你认为估计值是①有偏的;②无效的或③不一致的吗? 详细阐述理由。 解答: (1) 在其他变量不变的情况下,一城市的人口越多或房屋数量越多,则对用水的需求越高。所以可期望HO和PO的符号为正;收入较高的个人可能用水较多,因此RE的预期符号为正,但它可能是不显著的;如果水价上涨,则用
30
置信区间(confidence interval)
接受区域(acceptance region) 临界区域(critical region) 拒绝区域(region of rejection) 临界值(critical values)。 显著性检验法(test of significance approach) 单边检验(one-tail test) 双边检验(two-tail test) 高斯-马尔可夫定律(Gauss—markov theorem)
预期均值(expected mean) 总体均值(population mean) 总体平均值(population average value), 条件期望(conditional expectation) 条件期望值(conditional expected value)
回归(regression) 被解释变量(explained variable) 解释变量(explanatory variable)
回归分析(regression analysis) 相关分析(correlation analysis) 估计值(estimate) 估计量(estimator) 确定的(deterministic or nonstochastic)
预期或总体的均值(expected or population mean) 截距(intercept) 斜率(slope) 线性回归模型(linear regression model) 多元线性回归模型(multiple linear regression model) 残差项或残差(residual term, residual)
随机误差项(random error term; stochastic error term) 样本回归方程(sample regression function: SRF) 总体回归方程(population regression function: PRF)
古典线性回归模型(CLRM: Classical Linear Regression Model) 回归标准差(S.E. of regression: 即随机误差项的标准差) 正规方程组(normal equation group) 原理(principle) 被解释变量均值(mean dependent variable) 被解释变量标准差(S.D. dependent variable) OLS(ordinary least squares,普通最小二乘法) WLS(weighted least squares,加权最小二乘法) 最大迭代次数(max iterations) 收敛(convergence)
46
线性性(linearity) 无偏性(unbiasedness) 有效性(efficiency) 一致性(consistency) 残差平方和(residual sum of squares, RSS) 回归平方和(explained sum of squares, ESS) 总离差平方和(total sum of squares, TSS) 正态概率图(normal probability plot)
边际消费倾向(marginal propensity to spend, MPS) 人均消费支出(per capita consumption expenditure, PCE) 人均可支配收入(per capita disposable personal income, PDPI) 偏斜率(partial slope) 偏回归系数(partial regression coefficient): 多元相关(multiple correlation) 判定系数(coefficient of determination) 调整的判定系数(ajusted coefficient of determination) SC(Schwarz Criterion,施瓦兹准则)
AIC(Akaike Information Criterion,赤池信息准则)
U(unrestricted model, 无约束模型) R(restricted model,有约束模型) 联合假设(joint hypothesis) 方差分析(ANOVA: analysis of variance) 渐近的(asymptotic) 恩格尔消费曲线(Engel expenditure curve) 菲里普斯曲线(Philips curve) 弹性(elasticity) 标准(criterion) 双(和多)对数模型(double and many log model)
半对数模型(semi-log model)多项式模型(polynomial models) 线性-对数对数-线性模型(linear log and log linear model)。 增长(幅度)模型(growth model),增长率模型(growth rate model) 单利增长率(instantaneous growth rate) 复利增长率(compound growth rate) 立方函数(cubic function) 三次多项式函数(third-degree polynomial)。 规模报酬参数(returns to scale parameter) 规模报酬不变(constants return to scale) 规模报酬递增(increasing returns to scale) 规模报酬递减(decreasing returns to scale) 基本方法(fundamental methods)
空间相关(spatial correlation) 规模效应(scale effect)
47
同方差(homoscedasticiti) 等方差(equal variance) 异方差(heteroscedasticity) 非等方差(unequal variance) 序列相关性或自相关性(autocorrelation) 残差图(residual plot) 滞后变量(lagged variable)
ARCH(autoregressive conditional heteroscedasticity model,自回归条件异方差模型) ILS(indirect least squares, 间接最小二乘法) 2SLS(two stage least squares,两段最小二乘法)
比较静力学(comparative statics) 弹性分析(elasticity analysis) 不变替代弹性(constant elasticity of substitution) 变替代弹性(variable elasticity of substitution) 灵活加速模型(flexible accelerator model)
SNA(system of national accounting,国民核算体系) MPS(material product balance system, 国民经济平衡表体系) 正向或逆向选择程序(forward or backward selection procedure) 条件指数或条件数(condition index or condition number)
GLS(generalized least squares, 广义最小二乘法) 白噪声(white noise) IV(instrumental variable, 工具本变量法)
格兰杰因果关系检验(Granger causality test) 伪回归(spurious regression) 模型变换法(model transformation approach)
加权的(weighted) 惯性(inertia) 迟缓性(sluggishness) 蛛网现象(the cobweb phenomenon)
诊断(detecting) 游程检验(runs test) 游程长度(length of the runs) h统计量(h-statistic) 一阶(first-order) 自回归(autoregressive) 广义差分方程或模型(generalized difference equation or model) 多重共线性(multicollinearity) 完全多重共线性(perfect multicollinearity) 接近多重共线性(near multicollinearity) 样本特性(sample specific) 剩余的(remaining) 同时的(simultaneously)
精确度(precision) 辅助(auxiliary) 从属(subsidiary) 设定误差(specification error) 逐步回归(stepwise regression):
48
主成份分析(factor or principal component analysis) 岭回归(ridge regression) 容许度(tolerance) PRC(principal component regression, 主成分回归)
重合回归(coincident regression) 平行回归(parallel regression) 汇合回归(concurrent regression) 相异回归(dissimilar regression) 虚拟变量(dummy variable) 虚拟变量陷阱(dummy variable trap) 基准类(base mark) 对比类(bench mark) 控制(control) 遗漏的(omitted) 季节模式(season patterns)
差别斜率(differential slope) 差别截距(differential intercept) 模型设定误差(model specification error or bias)。 有限最小二乘法(restricted least squares, RLS)
无限制条件的最小二乘法(unrestricted least squares, ULS) 线性恒等或不等约束(linear equally or inequality restriction) 动态性(dynamic) 同时期(contemporaneous) 处罚因子(penalty factor) 分布滞后模型(distributed lag models) 自回归模型(autoregressive models)
自适应预期模型(adaptive expectations models)
局部(部分)或库存调整模型(the partial or stock adjustment model) 二分的(dichotomous) 伪回归(spurious regression)
选择的(alternatives) 多值的(multinominal) 分组数据(grouped data) 平稳时间序列(stationary time series) 协整(cointegration) 带漂移项的随机游走模型(random walk model with drift) 格兰杰代理定律(Granger representation theorem) 误差修正模型(error correction model)
随机趋势(stochastic trend)和确定趋势(deterministic trend)。 短期或即期乘数(short-run or impact multiplier), 中期乘数(interim or intermediate multiplier) 长期或总乘数(long-run or total multiplier)
单元根(unit root) 联立方程模型(simultaneous equation models) 内生变量(endogenous variable)
49
外生变量(exogenous variable) 前定变量(predetermined variable) 行为方程(behavioral) 恒等关系(identity relation) 结构式模型(structural form equation) 简化式模型(reduced form equation)
非一致的(inconsistent) 影响乘数(impact multiplier) 识别问题(the identification problem)
不可识别(unidentified) 恰好识别(exactly or just-identified)
过度识别(over-identified) 阶条件(order condition) 秩条件(rank condition) 表面不相关回归(seemingly unrelated regression) 随机影响模型(random effects model) 定性响应模型(qualitative response models) 二元选择模型(binary choice model) 多元选择模型(multinomial choice model) 实际观测数据(actually observed data)
一定的置信度(some degree of confidence) 假设的(hypothetical) 无规律的(erratic) 矩阵代数(matrix algebra) 准确地表述问题(precisely formulating the question) 模型的设定(the specification of model) 钟形的(bell-shaped) 负无穷大(minus infinity)正无穷大(plus infinity)
希腊字母上加的“帽”(“hats” on Greek letter)(表示估计量或估计值) 收敛速率(the rate of convergence)
诊断性检验(diagnostic tests) 隐含的假设(the implicit assumption) 数据来源(data sources) 个体(individuals) 修正(correction)
汇总(aggregation) 增补或插入(interpolation) 原始数据(the raw data) 随机缺失(missing at random) 非随机损耗(nonrandom attrition)
稳健的(robust) 抛硬币(tossing a coin) 嵌套的(nested) 模拟(simulation) 精简的(parsimonious) 后验分布(posterior distribution)
混合检验(portmanteau test) 模型设定检验(model specification test) 冗余变量(redundant variable) 共同趋势(common trends)
50