统计学导论第二版习题详解 (1)(7)

2018-12-27 18:45

A.样本容量 B.自变量预测值与自变量样本平均数的离差

C.自变量预测误差 D. 随机误差项的方差

二、判断分析题

1．产品的总成本随着产量增加而上升，这种现象属于函数关系。

答：错。应是相关关系。总成本会随着产量增加而增加，但一般来讲它们之间并不存在确定的数值对应关系。

2．相关系数为0表明两个变量之间不存在任何关系。

答：.错。相关系数为零，只表明两个变量之间不存在线性关系，并不意味着两者间不存在其他类型的关系。

3．单纯依靠相关与回归分析，无法判断事物之间存在的因果关系。答：对，因果关系的判断还有赖于实质性科学的理论分析。

4．圆的直径越大，其周长也越大，两者之间的关系属于正相关关系。答：.错。两者是精确的函数关系。

5．样本回归函数中的回归系数的估计量是随机变量。答：对。当抽取的样本不同时，其取值也有所不同。

6.当抽取的样本不同时，对同一总体回归模型估计的结果也有所不同。

答：对。因为，估计量属于随机变量，抽取的样本不同，具体的观察值也不同，尽管使用的公式相同，估计的结果仍然不一样。

三、证明题

?是标准一元线性回归模型中总体回归系数?的最优线性无偏估计量。 1．试证明最小二乘估计量?22证明：（I）无偏性：

?)??证明略，可参见教材P170页，公式7.29式的证明。 E(?22（II）线性：令kt(Xt?X)YtXt?X??，则?2???ktYt 22Xt(Xt?X)???由此可见，?是Y的一个线性函数。它是以k为权重的Y?2ttt?是一个线性的一个加权平均，从而?2统计量。

（III）最小方差性设?2~~??atYt为?2的任意线性无偏估计量，现讨论var(?2)的取值情况。

因为：

~E(?2)??atE(?1??2Xt?ut)??1?at??2?atXt??atE(ut)??2也即，作为

?2的任意线性无偏估计量，必须满足下列约束条件：

??[a??(2又因为varYt?，所以： ?(XX?X)?????2tt2t?at?0；且?tXt?1 Xa?X?2?[at?[?(Xt?X)2]2

~X项?2Xt?1X2式：由于Xt?分析此第二是常数，所以var?(2)只能通过第一项?2??[at?][]22)2(X?X(Xt?2X)?(Xt?Xt??XtX)t~2222var(?)?varaY?avarY??a(X?X)X?X?ttt??t tt222t2?Xt?X2]2t?X)?[a??(Xt?X)2]??]的处理使之最小化。 2(Xt?)XXX?22~1??2??[ata??tXt?X]??明显，若令，可以取最小值，即： var(?22t2)2(X?X)(X?X)?ttX?X)(t~??12?) minvar(?2)???var(?22(X?X)?t?是标准一元线性回归模型中总体回归系数?2的最优线性无偏估计量。所以，?2?

四、计算题

1．设销售收入Ｘ为自变量，销售成本Ｙ为因变量。现已根据某百货公司１２个月的有关资料计算出以下数据：（单位：万元）

?(X?X)= 425053.73 ； X = 647.88；

?(Y?Y) = 262855.25 ； Y = 549.8； ?(Y?Y)(X?X)= 334229.09

t2t2tt 试利用以上数据

(1) 拟合简单线性回归方程，并对回归系数的经济意义做出解释。 (2) 计算决定系数和回归估计的标准误差。 (3) 对β2进行显著水平为５％的显著性检验。

(4)假定明年１月销售收入为800万元，利用拟合的回归方程预测相应的销售成本，并给出置信度为９５％的预测区间。

t???t??0.7863 （1）?22425053.73(Xt?X)?????Y??X?549.8?0.7863*647.88?40.3720

解：

(Y?Y)(X?X)334229.091（2）r2?(Y?Y)(X?X)]

?(X334229?X).??092(Y?Y)??0.999834

[tt2t2t22?e2t?(1?2r2)?(Y?Y)2?43.6340

425053.73*262855.25t?2.0889 n?2（3）H0:?2?0,H1:?2?0

Se??e?245.4120

S??0.0032042t?/2(n?2)?t0.05(10)?2.228

2t???Se2.0889S?????0.003204 22??(X425053.73?0.7863t?X)2? 32

t值远大于临界值2.228，故拒绝零假设，说明?2在5％的显著性水平下通过了显著性检验。（4）Yf?40.3720?0.7863*800?669.41（万元）

(Xf?X)211(800?647.88)2Yf的置信度为95％Sef?S1???2.00891???2.1429 所以，2n12425053.73(Xt?X)的预测区间为：

?Yf?t?/2(n?2)Sef?669.41?2.228*1.0667?669.41?2.3767

所以，区间预测为：

664.64?Yf?674.18

2．对9位青少年的身高Y与体重X进行观测，并已得出以下数据:

?Y?13.54 ,?Y?XY?803.02

ii2?22.9788,

?Xi?472,

?Xi2?28158,

ii要求：

（1）以身高为因变量，体重为自变量，建立线性回归方程。（2）计算残差平方和与决定系数。

（3）计算身高与体重的相关系数并进行显著性检验。（自由度为7，显著水平为0.05的t分布双侧检验临界值为2.365。）

（4）对回归系数β2进行显著性检验。解：

?Xt?Yt

n?Xt??13.54(?Xt)9?803.02-472?0.027296 =

?2?（1）?22n?XtYt????t?????12n29?28158（-472）YXtn?X ?Y??2 =13.54/9-0.027296?472/9=0.072912 回归方程为：Y=0.072912+0.027296X (2)

?e??Y2t2t?Y?????1?t2?XtYtSSESST

=22.9788-0.07292?13.54-0.027296?803.02?0.072338

ｒ2＝

（3）r= t＝

t统计量远大于临界值，表明身高与体重显著线性相关。（4）S??＝

20.999979=0.999989

?7rn?20.999989==577.3441

1?r21-0.999979SSRSST=1-

（472）/9）=0.999979 =1-0.072338/（28158-

?(Xt?X)2*2 =

2e?t? n?2?x2t?(?xt)2/n

=0.101656/

2 T统计量远大于临界值，表明回归系数β2 显著不为0。

?2???t??＝

S??228158-472*472/9=0.001742

=0.027296/0.001742=15.66656

3．我国历年的GDP和最终消费资料如下所示。我国的国内生产总值与最终消费单位：亿元年份国内生产总值 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 3605.6 4074.0 4551.3 4901.4 5489.2 6076.3 7164.4 8792.1 10132.8 11784.0 14704.0 16466.0 2239.1 1990 2619.4 1991 2976.1 1992 3309.1 1993 3637.9 1994 4020.5 1995 4694.5 1996 5773.0 1997 6542.0 1998 7451.2 1999 9360.1 2000 10556.5 消费年份国内生产总值 18319.5 21280.4 25863.6 34500.7 46690.7 58510.5 68330.4 74894.2 79003.3 82673.1 89112.5 11365.2 13145.9 15952.1 20182.1 26796.0 33635.0 40003.9 43579.4 46405.9 49722.7 54617.2 消费资料来源：《中国统计年鉴》，中国统计出版社，2001年版。试根据上表的资料利用Excel软件完成以下问题。 (1) 拟合以下形式的消费函数： Ct＝β1＋β2Yt＋β3Ct-1＋Ut

式中：Ct是ｔ期的消费；Ct-1是ｔ－１期的消费；Yt是t期的GDP。

(2) 计算随机误差项的方差估计值、修正自由度的决定系数、各回归系数的ｔ统计量，并对整个回归方程进行显著性检验。

(3) 假设2001年的国内生产总值为95350亿元，试利用拟合的消费函数预测当年的消费总额，并给出置信度为９５％的预测区间。

解：

（1）消费函数的拟合步骤一：构造EXCEL工作表

步骤二：进行回归分析

在“数据”选项卡，点击“数据分析”，在弹出的对话框中选中“回归”分析工具，单击“确定”，调出“回归”分析对话框。

按图所示填写，最后点击“确定”，得到回归分析的输出结果见下表。

回归统计

Multiple R R Square Adjusted R Square 标准误差观测值方差分析

回归分析残差总计

Intercept Yt Ct-1

df 2 19 21

SS 6447302985 3715553.88 6451018539

MS 3223651493 195555.4674

16484.58893 t Stat 3.353325287 15.66029688 4.938891517

Significance F 1.674E-31 P-value 0.003338688 2.57372E-12 9.11373E-05

下限 95.0% 175.4390449 0.387359846 0.152113807

上限 95.0% 758.1539251 0.506875902 0.375861302

0.999712 0.999424 0.999363 442.2165 22

Coefficients 466.796485 0.447117874 0.263987555

标准误差 139.2040572 0.028551047 0.05345077

因此回归方程为：

Ct?466.7965?0.4471Yt?0.2640Ct?1

（2）根据回归输出结果，可以得到随机误差项的标准差估计值为：S＝442.2165 修正自由度的决定系数：Adjusted R Squares＝0.9994 各回归系数的t统计量为：

t???3.3533；t???15.6603；t???4.9389

123整个方程的显著性检验：F统计量为16484.6，远远大于临界值3.52，说明整个方程非常显著。（3）预测

使用EXCEL进行区间估计步骤如下：步骤一：构造工作表

其中，C2:E23存放的是自变量矩阵X，C25:E25存放的是矩阵Xf，G3:G5存放的是回归系数估计值矩

?，将这三个区域分别命名为X，Xf，B。G6存放的是估计标准误差。以上均为原始输入数据。G8:G13阵?存放的则是一些中间变量及最终计算结果。

步骤二：单元格区域的命名

先定义矩阵X。选定C2:E23，在“公式”选项卡，单击“定义名称”，在弹出对话框的“名称”框中输入“X”，再单击“确定”即可。参见下图。同样，对矩阵Xf和B进行命名。

共8页:

统计学导论第二版习题详解 (1)(7).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档