2.1 一元线性回归有哪些基本假定?
答: 假设1、解释变量X是确定性变量,Y是随机变量;
假设2、随机误差项ε具有零均值、同方差和不序列相关性: E(εi)=0 i=1,2, …,n Var (εi)=?2 i=1,2, …,n Cov(εi, εj)=0 i≠j i,j= 1,2, …,n 假设3、随机误差项ε与解释变量X之间不相关: Cov(Xi, εi)=0 i=1,2, …,n
假设4、ε服从零均值、同方差、零协方差的正态分布 εi~N(0, ?2 ) i=1,2, …,n 2.2 考虑过原点的线性回归模型 Yi=β1Xi+εi i=1,2, …,n
误差εi(i=1,2, …,n)仍满足基本假定。求β1的最小二乘估计 解: 得:
?)?(Y??Qe??(Yi?Y?i?1Xi)2i2i?1i?1nnn?Qe?X)X?0??2?(Yi??1ii???i?11???1?(XY)iii?1nn?(Xi?12i)2.3 证明(2.27式),?ei =0 ,?eiXi=0 。
证明:
????X))2?)2??(Y?(?Q??(Yi?Yii01i11nn
????X???其中: Yi01i
即: ?ei =0 ,?eiXi=0
?ei?Yi?Yi?Q?0???0?Q?0???12.4回归方程E(Y)=β0+β1X的参数β0,β1的最小二乘估计与最大似然估计在什么条件下等价?给出证明。
2
答:由于εi~N(0, ? ) i=1,2, …,n
2
所以Yi=β0 + β1Xi + εi~N(β0+β1Xi , ? ) 最大似然函数:
1 L(?,?,?2)??nf(Y)?(2??2)?n/2exp{?01i?1ii2
2??i?1n[Yi?(?0??1?0,Xi)]2}n1Ln{L(?0,?1,?2)}??ln(2??2)?22?2
?i?1n[Yi?(?0??1?0,Xi)]2?,??就是β0,β1的最大似然估计值。 使得Ln(L)最大的?10同时发现使得Ln(L)最大就是使得下式最小,
????X))2?)??(Y?(?Q??(Yi?Yii01i211nn
上式恰好就是最小二乘估计的目标函数相同。值得注意的是:最大似然估计是在εi~N(0, ?2 )的假设下求得,最小二乘估计则不要求分布假设。
2
所以在εi~N(0, ? ) 的条件下, 参数β0,β1的最小二乘估计与最大似然估计等价。
?是β0的无偏估计。 2.5 证明?0nnXi?X1?)?E(Y???X)?E[证明:E(?Y?XYi) ?i?01ni?1Li?1xxnXi?XXi?X11?E[?(?X)Yi]?E[?(?X)(?0??1Xi ??i)]
LxxLxxi?1ni?1nnXi?XX?X11?E[?0??(?X)?i]??0??(?Xi)E(?i)??0LxxLxxi?1ni?1nnn2.6 证明 证明:
n?)?(1?Var(?0nX2??Xi?1ni?X?1X2)???(?)nLxx222nX?XXi?X211i?)?Var[(?XVar(?)Y]?[(?X)Var(?0??1Xi ??i)] ??0inLnLi?1i?1xxxxXi?XXi?X22121X22??[()?2X?(X)]??[?]?
nnLxxLxxnLxxi?1n2.7 证明平方和分解公式:SST=SSE+SSR
证明:
?)?(Y??Y]2SST???Yi?Y???[Yi?Yii2i?1i?1nn?????ni?1n??YYi?2?2??ni?1n?)(Y??Y??)Yi?Y?Yi?Yiiii?1?n??2??i?1???Y2??)Y?Yi?Yiii?1???2?SSR?SSE2.8 验证三种检验的关系,即验证: (1)t?(n?2)r1?r2?Lxx?SSR/121;(2)F? ??t2?SSE/(n?2)?2证明:(1)
?L?rLyyLxxrLyy??n?2rn?2rxxt??????
22??SSE(Lxx(n?2))SSE(n?2)SSESST?Lxx?1?r(2)
nnnn????x?y)2?(y???(x?x)?y)2?(??i?y)??(?SSR??(y???1(xi?x))2???12Lxx01i1i2i?1i?1i?1i?1?2L?SSR/1?F??12xx?t2
?SSE/(n?2)?1(xi?x)222.9 验证(2.63)式:Var(ei)?(1??)?
nLxx证明:
?i)?var(yi)?var(y?i)?2cov(yi,y?i)var(ei)?var(yi?y????x)?2cov(y,y???(x?x))?var(y)?var(?i01ii1i(xi?x)21(xi?x)221????[?]?2?[?]nLxxnLxx22
1(xi?x)22?[1??]?nLxx?(x?x))?Cov(y,y)?Cov(y,??(x?x))Cov(yi,y??1iii1in(x?x)1n其中:?Cov(yi,?yi)?(xi?x)Cov(yi,?iyi)ni?1Li?1xx
12(xi?x)221(xi?x)22?????(?)?nLxxnLxx2.10 用第9题证明证明:
?2?e??2in?2是?2的无偏估计量
1n1n2?)??)?E(?E(yi?yE(ei2)??n?2i?1n?2i?121n1n1(xi?x)22?var(ei)?[1??]? ??n?2i?1n?2i?1nLxx?1(n?2)?2??2n?22.11 验证决定系数与F值之间的关系式
r2?证明:
F
F?n?2SSRSSR1??SSTSSR?SSE1?SSE/SSR1?
n?21?SSR/(SSE/(n?2))1F??n?2F?n?21?Fr2?2.14 为了调查某广告对销售收入的影响,某商店记录了5个月的销售收入y(万元)和广告费用x(万元),数据见表2.6,要求用手工计算: 表2.6 月份 X Y 1 1 10 (1) 画散点图(略)
(2) X与Y是否大致呈线性关系? 答:从散点图看,X与Y大致呈线性关系。
(3) 用最小二乘法估计求出回归方程。
计算表
X 1 Y 10 (Xi?X)2 (Yi?Y)2 2 2 10 3 3 20 4 4 20 5 5 40 (Xi?X)(Yi?Y) ? Yi6 ??Y)2 (Y??Y)2 (Yiii(-14)2 (-4)2 4 100 20 2 3 4 5 和15 均3 10 20 20 40 100 1 0 1 4 和Lxx=10 100 0 0 400 Lyy=600 10 0 0 40 和Lxy=70 13 20 27 34 和100 均20 (-7)2 0 72 142 SSR=490 (3)2 0 72 (-6)2 SSE=110 均20 70??Y???X?20?3?7??1.?7,?01Lxx10????X??1?7X???回归方程为: Y01? ?1??(4) 求回归标准误差 先求SSR(Qe)见计算表。 所以
Lxy???Qe110??6.055.n?23? , ?? 的置信度为95%的区间估计; ?(5) 给出0 1??由于(1-?)的置信度下, 的置信区间是 i查表可得 t?/2(n?2)?t0.025(3)?3.182??t??s,???t??s)(???ii??2i2iS???1?2?Lxx?36.667?1.915 10所以? ? 1的95%的区间估计为:(7—3.182*1.915,7+3.182*1.915),即(0.906,13.094)。
S??01X2125?(???)?36.667(?)?6.351
nLxx5102所以? ? 0 的95%的区间估计为:(-1-3.182*6.351,-1+3.182*6.351), 即(-21.211, 19.211)。?0的置信区间包含0,表示?0不显著。 (6) 计算x和y的决定系数
^^R2?SSRSSR490???0.817SSTLyy600说明回归方程的拟合优度高。 (7) 对回归方程作方差分析
方差分析表
方差来源 平方和 自由度 均方 F值