商学院计量经济学课程学习指导提要

2018-11-08 15:01

计量经济学课程学习指导提要

任课教师：苏州大学商学院李德光（请同学们在收到此文件后，先立即浏览一遍）

一、课程意义

计量经济学在欧美发达国家高校被列为商学院商科各专业（经济，管理，财经，财会，财政，金融，贸易，营销和电商类专业）学生（学士，硕士和博士）的少数几门核心课程之一。对计量经济学理论和方法的掌握和应用，已成为不同高校商科各专业的教研人员和学生之间专业学术能力评价的重要指标之一。

通过学习，学生可以提高对概率论和数理统计的理论和实践的素养，掌握计量经济学的理论和方法，综合运用多门知识，培养解决实际问题的能力，掌握模型方法和软件。

近10多年来，中国国内的经济管理财经金融财政财会营销电商贸易类等商科专业方面的学术期刊（尤其是高水平的权威及核心期刊），也普遍要求投稿的稿件具有计量经济学模型的实证分析，否则，稿件（以往的稿件大都仅仅是文字性的定性的理论论述）将很难被录用，这从一个方面反映了计量经济学地位的日益重要。

希望同学们对这门课程的学习给予一定的重视。

二、有关知识提要

概率论是计量经济学的重要数学方法基础之一。随机试验，总体，元素，样本，样本点，事件，随机现象，“频率稳定性”，概率，随机变量及其分布等等。随机变量及其概率分布是概率论的最基本和最核心的概念。随机变量的引入，使我们能用各种数学方法来研究随机现象，使概率论的内容更加丰富多彩，应用更加广泛。随机变量的变化规律（概率分布）和数字特征（数学期望，方差等）。

在实际研究过程中，我们实际拥有的只有样本，但却要藉此获悉总体的信息，并获得对总体参数的判断，于是，就有了参数估计（点估计和置信区间估计）和假设检验（小概率事件原理是假设检验推断准则的基础，具有十分重要的意义）

这两大分支所构成的数理统计的统计推断技术。

统计量是样本的随机函数，是对样本中信息的有效提炼和提取，是一个随机变量。这是数理统计最基本和最重要的核心概念。在计量经济学中，我们要用到随机统计估计量和随机统计检验量。正态分布，?2,t,F分布是计量经济学理论和实践中用到的主要的分布。其中的t分布在计量经济学中的应用最为广泛，使用频率最高。

而随着自由度的增加，?2,t,F分布都将逐渐接近正态正态分布。

估计值是真值的估计，或真值的替代，而不是真值；真值是客观和真实存在的，但我们并不知道；如果我们知道，就不需要进行估计和检验了。因此，寻找真值的估计和真值的置信区间是我们的重要任务之一。

在各种以分布为基础的假设检验中，我们一般取5％为显著水平，这是我们在教学中一般选取的显著水平，也是理论和实际研究中较多选取的显著水平。但，我们有时也选取1%或（及其之间的数值）作为显著水平。需要指出的是，显著水平的选取并无定规，要根据研究者所处的环境，以及对实际情况和风险程度的把握和态度而定。但一般来说，选取5%是比较常见，稳妥和恰当的。

多元线性模型的分析和研究对矩阵代数有很大的依赖性。矩阵及其运算：定义，运算（加，减，乘，转置，逆）。

三、教材选择

教材选用的是由上海财经大学出版社2010年出版的《计量经济学教程》的第二版。这本教材涵盖了教育部制定的经济管理财经金融财会营销电商类各专业本科生计量经济学课程学习的基本要求的全部内容，课程体系完整。

教材在理论和实际操作的结合方面做得很好，第六章介绍了Eviews的主要内容和操作使用，可以方便学生很快掌握Eviews。教材的后面还有课程实验，可以方便学生运用Eviews做练习。

第二章“回归模型”是全书以及计量经济学教学和研究的基础，在这一章中，要建立回归分析所涉及的许多基本概念及符号含义，重要的假定，重要的数量关系，以及基本的估计和检验的理论和方法等，并为后续各章的学习和研究，提供理论和方法基础。

对这一章内容的仔细理解和透彻掌握，将使后续各章的学习变得顺利。

教材中存在的一些小问题，在此更正如下：

（1）P6中，时间序列数据的定义改为：即按时间先后顺序排列的一个单位的数据。横截面数据的定义改为：即某一时点上的不同单位的数据。

（2）P11中的Brometrics改为Biometrics。

（3）P13中的第一行中的“这导致了对传统计量经济学的理论方法的质疑”改为“这导致了对传统计量经济学在极少数领域应用效果的质疑”。

（4）P19中第四行，“只有了解了总体的整个概率分布情况”改为“只有了解了总体的所有数据和整个概率分布情况”。

（5）P27倒数第四行的“我国税收将增加”改为“我国税收将平均增加”。（6）P29中，“二、最小二乘估计的性质”改为“二、最小二乘估计量的性质”。

（7）P32中，“（一）OLS估计的概率分布”改为“（一）OLS估计量的概率分布”。

（8）P32的?i~(0,?2)改为?i~N(0,?2)

（9）P72的“（1）假定的含义及其违反的原因”改为“假定违反的含义及其产生的原因”。

（10）P84倒数第9行的RESI D中I与D之间的空格必须去掉。（11）P41中间的

四、出勤出力

课程的理论、方法和应用的知识是渗透在听课，记笔记，上机，做作业等多个相互促进的有机环节。所以，学生应全面认真地参与各环节的学习，做到出勤，以保持学习的渐近性、连贯性和积累性，全面掌握所学的知识。

学习要出力，即要勤奋。

阅读教材时要注意概念，公式，理论和方法，以及相互间的联系。由于本课程有一定的难度，所以，本课程的学习，需要教学双方的相互配合和共同努力。欢迎同学们对任课老师的教学提出批评和改进的意见，任课老师

?(y?y?e)i?2改为

?(y?y?e)ii?2。

的邮箱：szldg@263.net 。

五、软件选择

本课程使用的软件是目前流行和广泛使用的Eviews，请同学从网上下载，3.1及以上版本都可以使用。建议选用3.1版本，这个版本的问题少，比较好用。3.1版本是目前国内较为普及的版本，版本经典，稳定性好。该版本完全可以满足本科生和研究生计量经济学课程的教学需要。

由于是网上下载的免费软件，所以，版本越低，所发布的版本的可用性和可靠性就越高。而免费的高版本存在的问题反而会多，容易出问题，不好用。

掌握软件使用方法是本课程重要的教学目标之一。请同学们在上机操作过程中认真阅读教材的第六章和教材后面的课程实验，并结合上课的内容进行学习和掌握。

课后的作业大都要使用Eviews完成。在使用Eviews软件时，要注意以下几点经常出现的细节问题：

（1）在输入一条命令后，一定要执行（回车）后，再输入下一条命令。否则，将出现错误，或无法运行，或没有出现合理的计算结果。因为前一条命令执行后的结果，要为下一条命令的执行提供逻辑基础和运算数据。

（2）在用DATA命令输入完数据后，要把光标从最后一个数据的尾部处移开，否则，可能会出现运算结果的错误。

（3）在一条命令中，不能有多余的空格，否则将出现错误。

例如，输入REDI D时，I和D之间多出一个空格，会导致软件运行的问题或错误的结果。

（4）在怀特检验中，有交叉项（cross term）和非交叉项（no cross term）的选择。一般情况下，为保证自由度不致减少，可选择非交叉项。

（5）在需要用到残差数据的上机练习中，一定要建立原始模型，因为只有在用LS命令对样本数据进行回归并建立模型之后，计算机里才能储存有计算出来的残差数据，这些残差数据可用于后续的各种分析和计算，切记！！

（6）练习的运算过程可以由软件的运行而很快地完成，因此，上机的主要工作是输入数据，以及对整个运算过程的通盘构架和实施过程的实现。所以，同

学们要保持思路的清晰，以驾驭整个运算过程；此外，在运算开始前，要保证输入数据的正确，输入数据后，最好再检查一遍。

六、作业布置（请每位同学认真完成）

第一次（第一章）作业：1．1.2 2．1.3 3．1.4 4．1.5。第一次作业满分为20分。

第二次（第二章）作业：1．2.13

（1）提示：只要在作业本上列出“输出表”中的有关栏目和数据即可，然后，把样本回归方程直接写在作业本上即可。

所谓的“斜率系数经济意义（含义）解释”就是：解释变量变动一个单位，被解释变量平均增加或减少的数量（就是斜率系数的数值。斜率系数为正号表示增加，负号表示减少）。

（2）只要将X=78107.8代入所建立的样本回归方程，就可以计算出1998年财政收入的预测值。

2．2.14的（1）和（2）。

提示：在（2）中，重新估计模型后，需要进行检验。这时，要注意：在剔除多余的解释变量后，模型中解释变量的个数已经发生变化；相应地，自由度也会发生变化。

3．2.15

第二次作业满分为40分。

第三次（第三章）作业：

3.8 要求：（1）根据Y，X的相关图分析是否存在异方差；如果存在，则要判断异方差的可能类型（递增型，递减型，或复杂型）；

提示：输入数据后，可用SCAT X Y命令产生图形，并对图形中点的分布情况进行分析和判断。

（2）利用怀特检验，帕克检验和戈里瑟检验进行异方差性的检验；提示：h的值一般取6个（h??1,?2,?1/2），所以戈里瑟检验一般（一定要）

要进行6次。

（3）利用WLS方法估计利润函数。提示：a.一共要构造4个权数：

b.从帕克检验的模型中产生一个，用帕克检验的模型中右端变量X的表达式的倒数作为一个WLS的权数。例如，若变量表达的形式是x1.6，则选权数为1/x1.6（为什么是倒数？请同学们想一想其中的道理）；

权数的产生命令为 GENR: GENR W1=1/X^1.6 (w1?1/x1.6) c. 从戈里瑟检验的模型中产生一个，戈里瑟检验要进行6次，并从中选出p值最小的一个方程（也是F值最大的一个方程），用这个p值最小的方程中右端变量X的表达式的倒数作为一个WLS的权数。例如，若变量表达的形式是X，则选权数为1/X（为什么是倒数？请同学们想一想其中的道理）；

权数的产生命令为 GENR: GENR W1=1/X (w2?1/x)

d.另外两个权数是w3?1/e和w4?1/e2，这两个权数是直接选取的（为什么直接选取这两个数学形式的权数？请想一想其中的道理）。

权数的产生命令为 GENR:

GENR W3=1/ABS(RESID) (w3?1/e); GENR W4=1/RESID^2 (w4?1/e2);

建立模型的命令方式：LS（W=权数变量） Y C X

或LS(W=Wi) Y C X 或在方程窗口中点击Estimate\\Options按钮，并在权数变量栏依次输入4个权数。

e.要从用WLS方法建立的4个模型中，挑选出一个最好的作为最终的模型。选择的准则是：

首先，进行第一步，要用怀特检验对用WLS所建立的4个模型进行检验，挑出那些不存在异方差的模型。注意：这个过程要用怀特检验来完成；

然后，进行第二步，从第一步中挑出来的这些模型中，再找出一个R2值最大的模型，即为最终的最佳模型。

第三次作业满分为40分。

每一次（每一章）的作业全部完成后（注意：是每一章的作业全部完成后！），请同学们在约定的交作业本的上课时间结束时，把作业本交给老师，或请学习委员或班长及时收集，并交给老师批改。

请各位同学在你们的作业本上写上班级，姓名和学号，尤其是学号不要漏掉！！以便老师登记作业成绩。

七、成绩构成

三次作业的累积总分，满分为100分，并作为平时的成绩。

平时，考试成绩的计算方法：平时成绩按10％计入总成绩。考试，卷面总分为100分，按90％计入总成绩。

八、考试题型

有概念阐述（即名词解释），填空，选择，简述或简答，分析和说明，计算，数学证明和推导等。

注意：学生在考试开始时，必须在考卷的有关栏目上填写自己姓名和学号，尤其是学号不要漏填！

九、重要论述（注意在课程的学习过程中逐渐加深理解） 1.估计方法，估计量和估计值

这是一组非常重要，又相互关联的概念，要在学习过程中逐步加深理解。（1）估计量：为估计真值?的估计值，从总体中抽取若干个容量为n的随机样本，所导出的样本值随机函数：??f(X1,X2,......,Xn,Y)，?称为?的估计量。?是样本数据的函数，在多次抽样得到多个样本的情况下（多次抽样肯定是做得到的），用这个随机函数可以计算出多个估计值的数值，这些数值形成的就是一个随机变量（参数估计量）。

重复一遍：在多次抽样的情况下，?是一个随机变量！！。

????（2）在代入一个具体的样本数据（一次抽样获得的数据）后，估计量（公式）为我们提供了参数真值?的一个估计值。十分清楚的是：有了估计量（公式），才会有估计值。即：估计值是某一个样本的数据代入估计量随机函数后，从估计量公式中所得到（计算出）的一个具体值，被称为真值?的一个估计值。

好的估计值取決于好的估计量；而好的估计量取決于好的估计方法。（3）在数学描述上，?这个符号有两个含义：参数估计量和参数估计值。在估计公式（估计量表达式）中，代入一个具体的样本的数据后，就可以得到一个估计值。

在符号上，我们对估计量和估计值并不加以区别，但，两者在含义上是有显著区别的（一个是随机变量，另一个是一个具体的值），要特别加以注意。

估计量告诉了我们如何计算真值的估计值的一种理论的规则或一个具体的公式，而估计值则仅仅是用此公式计算出来的一个数值而已。

（4）本教材采用的OLS方法（在满足基本假定的情况下）是一个好的估计方法，得出的估计量是好的估计量（线性性，无偏性和有效性），因此，由这种OLS估计量得出的估计值是一个好的（即接近真值的，准确的）估计值。

这就是三个概念之间的相互关系。

2.计量经济学注重定量分析（主要采用模型方法），但，并不忽视定性因素的影响，为了表达和研究定性因素的作用，计量经济学引入了虚拟变量。虚拟变量D的引入，使计量经济模型的形式、内容和应用得到了相当程度的丰富。

3.古典的回归分析仅仅能解决满足基本假定的实际问题，而计量经济学不但可以解决满足基本假定的实际问题，还能解决不满足基本假定的实际问题。所以，计量经济学又被称为现代回归分析。

十、基本符号，有关符号和英文的说明

1. m表示随机试验中结果的个数，也就是事件的数目。

2. N表示总体中的元素（单位）的个数，即总体元素（单位）数目。同时，N还表示正态分布（normal distribution）。

3. E（）表示期望或均值， D（）表示方差，Cov（）表示协方差。

? 8

4. n表示样本点（数据组）的个数，即样本容量（sample size）。observations，观察次数，即样本点的个数，英文缩写obs也表示样本容量n。

5. (X1i,X2i,......Xki,Yi)表示样本数据，共有n组（n个样本点，。 i?1,2,......n）6. k表示模型中解释变量的个数。

7. 随机误差项一般用?i来表示；也可以用?i来表示。

8．GENR是生成新的数据序列的命令，是Generate（发生，生成的意思），参见P296。

9．在EViews的命令中，LOG实际上是指自然对数ln，参见P297。 10．P98例4中的iteration，是“迭代”，“循环”的意思。

11．R-squared: 即判定系数R2；Adjusted R-squared：即调整的判定系数

R2。

12. Sum squared resid: 即残差平方和，RSS或

?e2i。

13. Durbin-Watson stat：即德宾—沃森统计量计算值。

14. Mean dependent var：即被解释变量的样本均值； S.D. dependent var：即被解释变量的样本标准差。

15. S.E. of regression：即回归模型的标准差的估计值?；也就是随机误差项?i的标准差的估计值?。

16. Std. Error : 即标准误差，也可简称标准差。

17. S.D. （Standard Deviation）:即标准差（要注意Std. Error与Standard Deviation在含义上的区别！！）。

十一、有关论述

1.经济理论侧重于提出命题和假说，多以定性描述为主，而无数量的或数学的，特别是没有随机性的数量的描述和研究。这是许多经济理论被质疑，导致经济学的可信度大大下降，并无法很好地应用于实践的主要原因之一，尤其在随机性日益普遍和加大的当今时代。

而计量经济学有效的解决了这一问题。计量经济学的存在，大大增加了经济

??学的可信度。

2.伟大的科学家冯﹒诺伊曼（Von Neumann）说：“科学的目的不只是解释现象，科学的主要任务是建立模型”。由此可见模型的重要性！

3.计量经济模型概括并表达了与所研究系统的相关（经济）理论，是理论用于实证研究的最有力和最方便的方式。人们通过建立和运用各种各样的模型，来揭示和阐明自然现象与社会经济现象的本质和规律。

4.1969年，首届诺贝尔经济学奖授予计量经济学家费里希和丁伯根（都是计量经济学家），高度评价他们“开发了经济分析过程的动态模型，并使之实用化”。

6. 随机关系的重要现实意义及其在计量经济学中的重要地位。

除了影响经济过程的各种随机因素外，模型的合理的必然简化也会带来随机性。所以，为使模型更加确切地说明客观经济现象，就有必要引入随机误差项?i，来反映那些未被选上的因素和随机性因素。

?i的内容十分丰富，是计量经济学的本质特征和重点研究内容。?i的引入，

使计量经济模型的准确性大大增加，这就是计量经济学得到广泛应用的原因。

近60年，经济活动频度的迅速加快，以及地域间经济互动的日益密切（市场经济和国际贸易），再加上通讯技术尤其是互联网的快速发展，信息传递和交换速度的加快，导致管理和经济活动的相互干扰日益加大，从而使经济和管理活动在21世纪初以来呈现出更明显和更普遍的随机性状况，这使得计量经济学在21世纪的理论的正确性和应用广泛性更加突出，地位愈加重要。

总之，经济活动本身固有的随机性，自然灾害，公共事件，信息技术的发展，不同文明间的冲突，人类本性和行为固有的随机性等，都会对经济活动和管理过程产生很大的随机性干扰和影响。对此，我们应该有充分的认识。

十二、习题示例

1.假定有如下的回归结果：yi?2.69?0.48xi其中，Y表示美国的咖啡的消费量（某天的个人消费的咖啡杯数），X表示咖啡的零售价格（美元/杯）。回答：

（1）这是一个时间序列数据回归，还是横截面数据回归？（2）如何解释截距的意义，它有经济含义吗？

? 10

（3）如何解释斜率的经济意义？－0.48是真值吗？（4）能否求出真实的总体回归方程？为什么？

解答：（1）这是一个横截面数据回归。因为是某一天的各人的样本数据（2）截距2.69表示咖啡零售价在t时刻为每杯0美元时，美国平均消费量为每天每人2.69杯，这个数字没有什么实际的经济意义（说明：常数项或截距项是在建模的过程中，所形成的一种数学状态，有时有一定的经济意义，但在大部分情况下，是没有什么具体的经济意义的，如果不可解释或不作解释，也没有什么关系）；

（3）斜率（估计值）-0.48表示消费量与咖啡零售价负相关，价格上升1美元/杯，则每天每人消费量平均减少0.48杯，此即斜率（系数）的经济意义

（说明：在多元线性回归模型中，某个解释变量的系数的经济意义是指，当其他的解释变量不发生变化时，这个解释变量变化一个单位，所引起的Y的上升或下降的平均变动幅度）；

－0.48仅仅是参数估计量分布上的一个具体值（一个点），不是参数的真值，所以－0.48不是真值（是真值的概率几乎等于零；但是，我们还不能说就一定是零）。

（4）不能；因为我们获得的是样本数据，我们不可能（也没有必要）获得美国所有消费者咖啡消费量及价格的全部数据，以及概率分布情况。所以，不能（也没有必要）求出总体回归方程。

2.已知回归模型E????N??i，式中E为某类公司一名新员工的起始薪金（元），N为所受教育水平（年）。随机扰动项?i的分布未知，其他所有的基本假定都满足。问：

（1）从直观及经济角度解释?和?。

?满足线性性、无偏性及有效性吗？简单陈述理由。 ?和?（2）OLS估计量?解答：（1）???N为接受过N年教育的员工的总体平均起始薪金。当N为零时，平均薪金为?，因此，此处的?表示没有接受过教育员工的平均起始薪金。

?是N每个单位变化（一年）所引起的E的变化，即表示每多接受一年学校教

育，所对应的薪金增加值。从经济和实际情况看，两个参数都应该是正值。

?满足线性性、无偏性及有效性，因为这些BLUE?和仍?（2）OLS估计量?性质的成立只需满足基本假定，而无需随机扰动项?i服从正态分布的假定。

3. 表1是以进出车站的乘客为主要服务对象的10家便利店的数据。y是日均销售额，x1是店铺面积，x2是作为选址条件的店铺距车站的距离。

表1 日均销售额、店铺面积和店铺距车站的距离的数据

店铺日均销售额（万元）店铺面积（平方米）x1 店铺距车站的距离（100米）x2 y A B C D E F G H I J 40 45 80 60 50 20 15 90 30 70 60 100 85 50 75 55 70 95 45 65 3 5 2 1 3 4 6 1 3 2 （1）根据Eviwes运行结果，写出多元回归模型y??0??1x1??2x2??行的样本回归方程；

（2）写出判定系数R2和调整的判定系数R2；

（3）假设其他条件不变，店铺面积增加1平方米，日均销售额能增加多少元？

（4）假设其他条件不变，店铺距车站的距离比现在远100米，日均销售额会减少多少元？

（5）假设有人想新建一个店铺K店，计划店铺面积为80平方米，距车站

300米，试预测其日均销售额yK。

解答：（1）根据Eviwes运行结果见下表，可知回归模型为：

???36.412?0.7546x1?13.078x2 yDependent Variable: Y Method: Least Squares Date: 04/22/06 Time: 15:28 Sample: 1901 1910 Included observations: 10

Variable C X1 X2

R-squared

Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat

Coefficient 36.41214 0.754585 -13.07769

Std. Error 8.171938 0.105887 1.213087

t-Statistic 4.455753 7.126326 -10.78050

Prob. 0.0030 0.0002 0.0000

0.956605 Mean dependent var 50.00000 0.944206 S.D. dependent var 5.918273 Akaike info criterion 245.1817 Schwarz criterion -30.18646 F-statistic 1.809788 Prob(F-statistic)

25.05549 6.637292 6.728067 77.15446 0.000017

（2）判定系数R2为0.956605和调整的判定系数R2为0.944206。（3）假设其他条件不变，店铺面积增加1平方米，日均销售额能增加7546元。

（4）假设其他条件不变，店铺距车站的距离比现在远100米，日均销售额会减少130776.9元。

（5）假设有人想新建一个店铺K店，计划店铺面积为80平方米，距车站300米，试预测其日均销售额yK为：

?36.41241?0.754585?80?13.07769?3?57.576444（万元）。

4. 某二元线性回归模型，有关的数据如下表：（此例较为完整地展示了多元线性回归模型的方方面面，比较典型，请同学们对照课堂上学习的内容，注意每一个矩阵及其所含各元素的意义，更要注意每一个矩阵的行列下标的数目及变化）。

1 2 3 4 5 要求：（1）写出Y，X；

（2）计算回归参数的估计值并写出模型；（3）计算样本判定系数R2和调整判定系数R；（4）计算检验统计量F值。

（5）计算?和各参数估计量的标准差。

?2Y 3 1 8 3 5 X1 3 1 5 2 4 X2 5 4 6 4 6 2?3??1?1??1???解答：（1）Y??8?,X??1???3???1???5???1315245?4??6? ?4?6???20??51525??，X/X??155581?， 76（2）X/Y?????????109???2581129???26.74.5?8.0???4.0??，B?(X/X)?1X/Y??2.5? (X/X)?1??4.51.0?1.5????????8.0?1.52.5????1.5??估计出库存费用的样本回归方程为：

y?4.0?2.5x1?1.5x2

? 14

ESSB/X/Y?nY2（3）R???0.9464 2/TSSYY?nY2n?1R?1?(1?R2)?0.8929

n?k?1（4）F??2B/X/Y?nY/kY/Y?bX/Y/n?k?1?/?2?17.6667

YY?B/X/Y?0.75 （5）??n?k?1?2/???0.75?0.8660，S(b0)??C11?0.866026.7?4.4749

S(b1)??C22?0.86601?0.8660，S(b2)??C33?0.86602.5?1.3693

判定系数R2和调整的判定系数R2的相互关系公式为：

???????R?1?(1?R2)

2n?1

n?k?15. 对下列模型：Yi????Xi?2Zi?ui （1）

Yi????Xi??Zi?ui （2）

求β的最小二乘估计值。

解答：将模型（1）改写成(Yi?2Zi)????Xi?ui，则?的估计值为：

(Xi?X)(Yi?2Zi?Y?2Z)???? 2(X?X)?i将模型（2）改写成Yi????(Xi?Zi)?ui，则?的估计值为：

(Xi?Z?X?Z)(Yi?Y)???? 2?(Xi?Zi?X?Z)此例表明：我们可以对变量进行代数变换。

这种代换不但可以对线性变量进行形式变换，而且可以将非线性变量变为线性变量，从而把可线性化的非线性模型变换为线性模型。而非线性的参数却很难

变为线性参数，所以模型的参数非线性问题是很难处理的。

第一，现实中的经济问题有一部分确实是线性的；第二，有一些非线性的经济问题在用线性模型表示时，误差不大，所以，完全可以采用线性模型进行表述和分析；第三，很多非线性问题，通过变量的代数变换，都可以转化为线性模型。所以，计量经济学主要采用线性模型是有可靠的现实依据的。

6 . 设有两个消费函数的计量经济模型

(a) Y?137.47?0.773X(5.87)(10.65)R2?0.86??

n?25(b) Y?254.27?0.216X(4.372)(?2.54)R2?0.89n?20

其中：Y表人均消费支出，X表人均可支配收入，括号中数值为t统计量的计算值值。

要求：（1）选择你认为合理的模型，并说明你的理由。（2）对你选择的模型，给出经济意义（单位为美元）。

解答：（1）合理的应模型为（a），原因是边际消费倾向（X的系数）不可能为负值，这样，才符合理论预期。

因为，经济意义检验是第一位的，是首要的。在经济意义合理的情况下（经济意义检验通过后），再对不同模型的统计检验指标进行比较。

（2）当人均可支配收入增加1美元时，人均消费支出平均增加0.773美元。

比较和选择模型的一般程序是：

（1）考察参数估计值（变量系数）的经济意义，即，进行经济检验，这是首先要做的，是第一位的；（2）第二步，在各模型的经济检验都通过的情况下，再考察各模型的解释变量是否通过了t检验；（3）第三步，在（1）（2）步都通过的情况下，再看哪个模型的判定系数的值大，就选哪个模型为合理（理想或最佳）的模型。

7．观察下列方程并判断其变量和系数是否呈线性？进一步的问题：哪些模型可转化为线性模型？哪些不能？哪些本身就是线性模型？

（1）Yi??0??1Xi3??i （2）Yi??0??1(?2Xi)??i （3）Yi??0?? （4）Yi??0??1X1i??2X2i10??i ?1Xii解答：（1）变量非线性、系数线性；（2）变量线性、系数非线性；（3）变量、系数均为非线性；（4）变量、系数均为线性.

（1）可进行变量线性化，可转化为线性模型；（2）（3）参数无法线性化，无法转化为线性模型（4）本身就是线性模型。

8. lnY?0.47?0.32lnX，X为企业销售收入，Y为研发支出（R&D），问：X增加1％和10％，Y增加的比例？

解答：0.32×1％＝0.32％，；0.32×10％＝3.2％。

9．一个由容量为209的样本估计的解释CEO薪水的方程为：

??ary)=4.59+0.2571n(sales)+0.01lroe+0.158finance+0.181cosprod-0.283utility ln(sal (15.3) (8.03) (2.75) (1.775) (2.130) (-2.895)

其中，salary表示年薪水(万元)、sales表示年收入(万元)、roe表示公司股票收益(万元)；finance、consprod和utility均为虚拟变量，分别表示金融业、消费品工业和公用事业，对比产业为交通运输业（所谓的对比产业，就是其变量没有列入模型的产业）。

(1) 解释三个虚拟变量参数的经济含义；

(2) 保持sales和roe不变，计算公用事业和交通运输业之间估计薪水的近似百分比差异。这个差异在1％的显著水平上是统计显著的吗?

(3) 消费品工业和金融业之间估计薪水的近似百分比差异是多少? 写出一个使你能直接检验这个差异在统计上是否显著的方程。

解答：(1) finance的参数的经济含义为：当销售收入与公司股票收益保持

不变时，金融业的CEO要比交通运输业的CEO多获薪水15.8个百分点。

其他两个参数的经济含义可作类似的解释。

(2) 公用事业和交通运输业之间估计薪水的近似百分比差异就是虚拟变量utility的参数估计值的百分数，即为28.3％。由于参数的t统计值为-2.895，它大于1％显著性水平下自由度为203的t分布的临界值1.96，因此这种差异是统计上显著的。

(3) 由于消费品工业和金融业相对于交通运输业的薪水百分比差异分别为15.8％与18.1％，因此它们间的差异为18.1％-15.8％=2.3％。一个能直接检验这一差异是否显著的方程为：

ln(salary)= β0+β11n(salse)+β2 roe +β3+

?1consprod+

?2utilty+

?3trans+μ

其中，trans为交通运输业虚拟变量。这里对比基准产业为金融业，因此?1表示了消费品工业与金融业薪水的百分数差异，其t统计值可用来进行显著性检验。

10. 美国研究人员研究了什么因素影响兼职工作者的兼职收入，模型估计结

?m?37.07?0.403w0?90.06race?113.64reg?2.26agew(0.062)(24.47)(27.62)(0.94)果为：

R2?0.74df?311

其中：wm为兼职工薪（美元/周）；w0为主业工薪（美元/周）； race为虚拟变量，若是白人取值为0，非白人取值为1；

reg为虚拟变量，当被访者是非西部人时，reg取值为0，当被访者是西部地区人时，reg取值为1；

age为年龄；关于这个估计结果，下列说法正确的有（）

A 在其他因素保持不变条件下，非白人的兼职工薪每周比白人低约90美元； B 在其他因素保持不变条件下，白人的兼职工薪每周比非白人低约90美元； C 在其他因素保持不变条件下，非西部人的兼职工薪每周比西部人高出约113.64美元。

D 在其他因素保持不变条件下，非西部人的兼职工薪每周比西部人低出约113.64美元。

解答：A D

11. 试在消费函数Yi??0??1Xi??i中，(以加法方式)引入虚拟变量，用以反映季节因素(淡，旺季)和收入层次差异(高，中，低)对消费需求的影响.

解答: Yi??0??1Xi??1D1??2D2??3D3??i

?1高收入?1中收入?1旺季D1? D2? D3? ?0淡季?0其他?0其他根据虚拟变量的设置原则，本题的第一个定性因素有两个状态，只应引入一个虚拟变量（若引入两个，则会落入虚拟变量陷阱）；本题的第二个定性因素有三个状态，只应引入两个虚拟变量（若引入三个，则会落入虚拟变量陷阱）。

12．在研究生产函数时，得到以下两种结果：

?t=-5.04 + 0.8871nKt + 0.8931nLt (A) 1nY S.E.= (1.40) (0.087) (0.137) R2=0.878 n=21

?t=-8.57 + 0.0272t + 0.4601nKt + 1.2851nLt (B) 1nYS.E.= (2.99) (0.020) (0.333) (0.324) R2=0.889 n=21

其中，Y=产量，K=资本，L=劳动，t=时间，n=样本容量。

请回答：

(1) 验证模型(A)中所有的系数在统计上都是显著的(5％)； (2) 验证模型(B)中t和lnK的系数在统计上不显著(5％)； (3) 可能什么原因造成了(B)中lnK的系数不显著;

(4) 如果t与lnK的相关系数为0.98，你将如何判断并能得出什么结论? 解答: (1) 模型(A)中三个系数对应的t统计量分别为:

?5.040.8870.893=-3.6 =10.195 =6.5182 1.400.0870.137查t分布临界值表得t0.025(18)=2.101，模型(A)中三个系数t统计量的绝对值均大于临界值2.101，因此所有的回归系数在统计上都是显著的。

(2) 模型(B)中t和lnK的系数对应的t统计量分别为：

0.02720.460=1.3333 =1.4193

0.02040.324查t分布临界值表得t0.025(17)=2.11，模型(B)中t和lnK的系数对应的t统计量绝对值均小于临界值2.11，因此回归系数在统计上不显著。

(3) 造成模型(B)中lnK系数不显著的原因是由于新变量t的引入，t与lnK之间可能存在严重的多重共线性。

(4) t与lnK的相关系数为0.98，表明两者相关程度很高，模型(2)存在严重的多重共线性。

13．根据美国1961年第一季度至1977年第二季度的季度数据，我们得到了如下的咖啡需求函数的回归方程：

?t=1.2789-0.1647lnPt+0.5115lnIt+0.1483lnP?t-0.0089T-0.0961D1t-0.1570D2t-0.0097D3t lnQ (-2.14) (1.23) (0.55) (-3.36) (-3.74) (-6.03) (-0.37) R2=0.80

其中：Q—人均咖啡消费量；P—咖啡的价格（以1967年价格为不变价格）；I—人均收入；P?—茶叶的价格（以1967年价格为不变价格）；T—时间趋势变量(1961年第一季度为1，??，1977年第二季度为66)；

D1t= =

1 第一季度 1 第二季度 1 第三季度

D2t= D3t= 0 其他 0 = 其他 0 = 其他

试回答下列问题：

(1) 模型中P、I和P?系数的经济含义是什么? (2) 咖啡的价格需求是否很有弹性? (3) 咖啡和茶是互补品还是替代品? (4) 如何解释时间变量T的系数? (5) 如何解释模型中虚拟变量的作用? (6) 哪一个虚拟变量在统计上是显著的(0.05)? (7) 咖啡的需求是否存在季节效应? 解答：

OLS(ordinary least squares，普通最小二乘法) WLS(weighted least squares，加权最小二乘法) 最大迭代次数(max iterations) 收敛（convergence）线性性(linearity) 无偏性(unbiasedness) 有效性(efficiency) 一致性（consistency）残差平方和(residual sum of squares, RSS) 回归平方和（explained sum of squares, ESS）总离差平方和（total sum of squares, TSS）

边际消费倾向（marginal propensity to spend, MPS）判定系数（coefficient of determination）

调整的判定系数（Ajusted coefficient of determination）双(和多)对数模型(double and many log model)

半对数模型（semi-log model）多项式模型(polynomial models) 线性－对数或对数－线性模型(linear log and log linear model)。同方差(homoscedasticiti) 异方差(heteroscedasticity) 序列相关性或自相关性（autocorrelation）

残差图(residual plot) 滞后变量(lagged variable) 自回归（autoregressive）多重共线性(multicollinearity) 完全多重共线性(perfect multicollinearity) 接近多重共线性(near multicollinearity) 自回归模型(autoregressive models)

商学院计量经济学课程学习指导提要.doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档