相关与回归分析——练习题
●1. 表中是道琼斯工业指数(DJIA)和标准普尔500种股票指数(S&P500)1988年至1997年对应股票的收益率资料:
年份 1988 1989 1990 1991 1992 DJIA收益率(%) S&P500收益率(%) 年份 16.0 31.7 -0.4 23.9 7.4 16.6 31.5 -3.2 30.0 7.6 1993 1994 1995 1996 1997 DJIA收益率(%) 16.8 4.9 36.4 28.6 24.9 S&P500收益率(%) 10.1 1.3 37.6 23.0 33.4 计算两种指数收益率的相关系数,分析其相关程度,以0.05的显著性水平检验相关系数的显著性。 解:(1)解法一:利用Excel进行表格计算相关系数
设DJIA收益率为x,S&P500收益率为y,将已知表格复制到Excel中, 列出计算x2、xy、y2及其合计数的栏目并进行计算,得结果如下:
(利用Excel计算进行表格计算的方法类似于标准差的Excel计算) DJIA收益率年份 (%) S&P500收益率(%) X2 xy y2 x 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 合计 16.0 31.7 -0.4 23.9 7.4 16.8 4.9 36.4 28.6 24.9 190.2 y 16.6 31.5 -3.2 30.0 7.6 10.1 1.3 37.6 23.0 33.4 187.9 256 1004.89 0.16 571.21 54.76 282.24 24.01 1324.96 817.96 620.01 4956.2 265.6 998.55 1.28 717 56.24 169.68 6.37 1368.64 657.8 831.66 5072.82 275.56 992.25 10.24 900 57.76 102.01 1.69 1413.76 529 1115.56 5397.83 代入相关系数计算公式得: r =
n?xy??x?yn?x???x)22n?y???y)22
1
=10?5072.82?190.2?187.910?4956.2?????????10?5397.83????????? = 0.948138
以上相关系数的计算结果说明,DJIA收益率与S&P500收益率的相关程度属于高度正相关。
(2)计算t统计量(免)
t?rn?2?10?21?r2?0.9481381?o.9481382?2.6817390.317859?8.436851
给定显著性水平=0.05,查t分布表得自由度n-2=10-2=8的临界值t?2为2.306, 显然t?t?2,表明相关系数 r 在统计上是显著的。 ●2.表中是16支公益股票某年的每股账面价值和当年红利:
公司序号 账面价值(元) 红利(元) 公司序号 账面价值(元) 红利(元) 1 22.44 2.4 9 12.14 0.80 2 20.89 2.98 10 23.31 1.94 3 22.09 2.06 11 16.23 3.00 4 14.48 1.09 12 0.56 0.28 5 20.73 1.96 13 0.84 0.84 6 19.25 1.55 14 18.05 1.80 7 20.37 2.16 15 12.45 1.21 8 26.43 1.60 16 11.33 1.07 根据上表资料:
(1)建立每股账面价值和当年红利的回归方程; (2)解释回归系数的经济意义;
(3)若序号为6的公司的股票每股账面价值增加1元,估计当年红利可能为多少?解: (1)设当年红利为Y,每股帐面价值为X
则回归方程为 Yi??1??2Xi,下面分别应用两种方法计算回归参数: 方法一:利用Excel进行表格运算计算公式元素: 账面价值公司序号 (元) 红利(元) x2 xy x y 1 22.44 2.4 503.5536 53.856 2 20.89 2.98 436.3921 62.2522 3 22.09 2.06 487.9681 45.5054 4 14.48 1.09 209.6704 15.7832 5 20.73 1.96 429.7329 40.6308 6 19.25 1.55 370.5625 29.8375 7 20.37 2.16 414.9369 43.9992
2
8 9 10 11 12 13 14 15 16 26.43 12.14 23.31 16.23 0.56 0.84 18.05 12.45 11.33 1.6 0.8 1.94 3 0.28 0.84 1.8 1.21 1.07 698.5449 147.3796 543.3561 263.4129 0.3136 0.7056 325.8025 155.0025 128.3689 42.288 9.712 45.2214 48.69 0.1568 0.7056 32.49 15.0645 12.1231 合计 261.59 26.74 5115.703 498.3157 将计算结果代入回归系数计算公式,得: 回归系数 β2? ?n?xy??x?yn?x2???x)2
16?498.3157?261.59?26.74 216?5115.703?(261.59)978.1346 = = 0.07287590
13421.9199 初始值 β1?y?β2x= =
?y?β?x
n2n26.74261.59?0.0728759?=0.47977458 1616^于是,回归方程为 Yi?0.479775?0.072876Xi
(2)参数的经济意义是:当每股帐面价值增加1元时,当年红利将平均增加0.072876元。
(3)序号6的公司每股帐面价值为19.25元,若增加1元后,每股帐面价值为X=20.25元,则当年红利估算为:
^Yi?0.479775?0.072876?20.25?1.955514(元)
●3.美国各航空公司业绩的统计数据公布在《华尔街日报1999年年鉴》(The Wall Street
Journal Almanac 1999)上。航班正点到达的比率和每10万名乘客投诉的次数的数据如下: 航空公司名称 航班正点率(%) 投诉率(次/10万名乘客) 西南(Southwest)航空公司 大陆(Continental)航空公司 西北(Northwest)航空公司 美国(US Airways)航空公司 联合(United)航空公司 美洲(American)航空公司 德尔塔(Delta)航空公司 美国西部(Americawest)航空公司 环球(TWA)航空公司 (1)画出这些数据的散点图;
81.8 76.6 76.6 75.7 73.8 72.2 71.2 70.8 68.5 0.21 0.58 0.85 0.68 0.74 0.93 0.72 1.22 1.25 3
(2)根据散点图。表明二变量之间存在什么关系?
(3)求出描述投诉率是如何依赖航班按时到达正点率的估计的回归方程; (4)对估计的回归方程的斜率作出解释;
(5)如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数是多少? 解:(1)利用EXCEL制作数据散点图:
将已知表格的后两列复制到Excel中,选择该表格后,点击:图表向导→XY 散点图→确定,即得散点图如下:
投诉率(次/10万名乘客)1.41.210.80.60.40.20657075航班正点率(%)8085
(2)根据散点图可以看出,随着航班正点率的提高,投诉率呈现出下降的趋势,说明航班整点率与投诉率两者之间,存在着一定的负相关关系。
[利用Excel的统计函数“CORREL”计算得到相关系数r= -0.88261,属于高度负相关]
(3)求投诉率依赖航班正点率的估计的回归方程
设投诉率为Y,航班正点率为X 建立回归方程 Yi??1??2Xi 解法二:应用Excel列表计算:
作出Excel运算表格如下:
航班正点率投诉率(次(%) /10万名乘客) x 西南(Southwest)航空公司 大陆(Continental)航空公司 西北(Northwest)航空公司 美国(US Airways)航空公司 联合(United)航空公司 美洲(American)航空公司 德尔塔(Delta)航空公司 美国西部(Americawest)航空公司 环球(TWA)航空公司 合 计 得回归系数为: β2?81.8 76.6 76.6 75.7 73.8 72.2 71.2 70.8 68.5 667.2 y 0.21 0.58 0.85 0.68 0.74 0.93 0.72 1.22 1.25 7.18
6691.24 5867.56 5867.56 5730.49 5446.44 5212.84 5069.44 5012.64 4692.25 49590.46 17.178 44.428 65.11 51.476 54.612 67.146 51.264 86.376 85.625 523.215 航空公司名称 x2 xy n?xy??x?yn?x???x)22 4
9?523.215?667.2?7.18 29?49590.46?(667.2)?81.561 = = —0.0704144
1158.3 ? 初始值 β1yx?? ?β?y?βx=
2n2n = 于是得回归方程为
7.18667.2?0.0704144?=6.01783 99 Yi?6.0178?0.07Xi
(4)参数的经济意义是:航班正点率每提高一个百分点,相应的投诉率(次/10万名乘客)下降0.07。
(5)航班按时到达的正点率为80%时,估计每10万名乘客投诉的次数可能为:
^??6.0178?0.07?80?0.4187(次/10万) Yi4. 表中是1992年亚洲各国人均寿命(y)、按购买力平价计算的人均GDP(x1)、成人识字率(x2)、一岁儿童疫苗接种率(x3)的数据 序国家和 平均寿命 人均GDP 号 地区 y(年) x1(100美元) 1 2 3 4 5 6 7 8 9 11 日本 中国香港 韩国 新加坡 泰国 马来西亚 斯里兰卡 中国大陆 菲律宾 蒙古 79 77 70 74 69 70 71 70 65 71 63 62 63 57 58 50 60 52 50 53 48 194 185 83 147 53 74 27 29 24 18 23 27 13 7 20 18 12 12 13 11 6 成人识字率一岁儿童疫苗接种率 x2(%) 99 90 97 92 94 80 89 80 90 95 95 84 89 81 36 55 50 37 38 27 41 x3(%) 99 79 83 90 86 90 88 94 92 96 85 92 90 74 81 36 90 69 37 73 85 5
10 朝鲜 12 印度尼西亚 13 越南 14 缅甸 15 巴基斯坦 16 老挝 17 印度 18 孟加拉国 19 柬埔寨 20 尼泊尔 21 不丹