实验11 - 统计回归模型(4学时)讲解(3)

2019-09-01 12:35

2. 软件开发人员的薪金p332~338

在下面给出的数据中:(存入文件p333.txt) 第1列 编号 第2列 薪金y

第3列 资历x1(从事专业工作的年数)

第4列 管理x2(1表示管理人员,0表示非管理人员)

第5列 教育x3,x4(1表示中学程度x3x4=10,2为大学x3x4=01,3为更高程度x3x4=00) 01 13876 1 1 1 02 11608 1 0 3 03 18701 1 1 3 04 11283 1 0 2 05 11767 1 0 3 06 20872 2 1 2 07 11772 2 0 2 08 10535 2 0 1 09 12195 2 0 3 10 12313 3 0 2 11 14975 3 1 1 12 21371 3 1 2 13 19800 3 1 3 14 11417 4 0 1 15 20263 4 1 3 16 13231 4 0 3 17 12884 4 0 2 18 13245 5 0 2 19 13677 5 0 3 11

20 15965 5 1 1 21 12366 6 0 1 22 21352 6 1 3 23 13839 6 0 2 24 22884 6 1 2 25 16978 7 1 1 26 14803 8 0 2 27 17404 8 1 1 28 22184 8 1 3 29 13548 8 0 1 30 14467 10 0 1 31 15942 10 0 2 32 23174 10 1 3 33 23780 10 1 2 34 25410 11 1 2 35 14861 11 0 1 36 16882 12 0 2 37 24170 12 1 3 38 15990 13 0 1 39 26330 13 1 2 40 17949 14 0 2 41 25685 15 1 3 42 27837 16 1 2 43 18838 16 0 2 44 17483 16 0 1 45 19207 17 0 2 46 19346 20 0 1 假设满足多元线性回归模型 y = α0 + α1 x1 + α2 x2 + α3 x3 + α4 x4 + ε

2.1(验证)基本模型p332~335

求回归系数及其置信区间(置信水平??= 0.05)、检验统计量R2、F、p、s2,有关散点图的MATLAB程序如下: .2 软件开发人员的薪金——基本模型 %模型:y=α0+α1*x1+α2*x2+α3*x3+α4*x4+ε clear;clc;format compact;format short g; M=dlmread('p333.txt'); %读取ASCII码文件 y=M(:,2); x1=M(:,3); x2=M(:,4); x3=M(:,5)==1; x4=M(:,5)==2; %教育程度 [a,aint,r,rint,stats]=regress(y,[ones(size(M,1),1) x1 x2 x3 x4 ]); fprintf('%2s%4s%9s\\n','参数','估计值','置信区间');%1个汉字算1个字符 for i=1:length(a) fprintf('α%7.0f [%5.0f, %5.0f]\\n',i-1,[a(i,:),aint(i,:)]); end 12

fprintf('\\nR2=%.3f F=%.0f p<%.4e s2=%.3e\\n',stats); subplot(121); plot(x1,r,'+'); %模型的残差ε与资历x1的关系 subplot(122); x234=(1+M(:,4)).*(M(:,5)==1)+(3+M(:,4)).*(M(:,5)==2)... + (5+M(:,4)).*(M(:,5)==3);%见p336表3 plot(x234,r,'+'); %模型的残差ε与管理-教育x2-x3,x4组合x234的关系 ☆ 给出程序的运行结果(数据和图形)(比较[334],[335]):

数据结果(比较[334]表2):

图形结果(比较[335]图1、图2): 13

2.2(编程)更好的模型p335~336

在题2.1的模型中增加x2与x3,x4的交互项后,多元线性回归模型为

y = α0 + α1 x1 + α2 x2 + α3 x3 + α4 x4 + α5 x2 x3 + α6 x2 x4 + ε 要求:

同题2.1,区别在于模型不同,所以要根据新模型修改题2.1的程序,仍后运行。

★ 给出程序和运行结果(程序、数据和图形)(比较[336]表4、图3、图4):

程序: .2 软件开发人员的薪金——基本模型 %模型:y=α0+α1*x1+α2*x2+α3*x3+α4*x4+ε clear;clc;format compact;format short g; M=dlmread('p333.txt'); %读取ASCII码文件 y=M(:,2); x1=M(:,3); x2=M(:,4); x3=M(:,5)==1; x4=M(:,5)==2; %教育程度 [a,aint,r,rint,stats]=regress(y,[ones(size(M,1),1) x1 x2 x3 x4 x2.*x3 x2.*x4]); fprintf('%2s%4s%9s\\n','参数','估计值','置信区间');%1个汉字算1个字符 14

for i=1:length(a) fprintf('α%7.0f [%5.0f, %5.0f]\\n',i-1,[a(i,:),aint(i,:)]); end fprintf('\\nR2=%.3f F=%.0f p<%.4e s2=%.3e\\n',stats); subplot(121); plot(x1,r,'+'); %模型的残差ε与资历x1的关系 subplot(122); x234=(1+M(:,4)).*(M(:,5)==1)+(3+M(:,4)).*(M(:,5)==2)... + (5+M(:,4)).*(M(:,5)==3);%见p336表3 plot(x234,r,'+'); %模型的残差ε与管理-教育x2-x3,x4组合x234的关系 数据结果(比较p336表4):

图形结果(比较p336图3、图4): 15


实验11 - 统计回归模型(4学时)讲解(3).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:答中国为什么需要无产阶级专政

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: