缺失数据地补充及异常数据地修正 - 图文(3)

2019-08-29 18:17

[3] 盛骤,概率论与数理统计,北京:高等教育出版社,2001年。 [4] 司守奎,数学建模算法与程序,北京:国防工业出版社,2007年。

[5] 郑向东,中国大气本底观测元数据,sci-data.cma.gov.cn,2013年7月21 日。

九、附录

附录一(一元多项式回归模型matlab程序): clear;

x=[37.0,37.5,38.0,38.5,39.0,39.5,40.0,40.5,41.0,41.5,42.0,42.5,43.0]; y=[3.40,3.00,3.00,2.27,2.10,1.83,1.53,1.70,1.80,1.90,2.35,2.54,2.90]; plot(x,y,'r*') hold on

p=polyfit(x,y,2); z=polyval(p,x); plot(x,z,'g-');

xlabel('x');ylabel('y');

legend('实际散点图','拟合曲线'); RMSE1=(z-y).^2;

RMSE=sqrt(sum(RMSE1,2)/13);

text(39.0,3.30,'拟合曲线为:z=0.16599*x^2-13.387*x+271.62'); text(39.0,3.50,'均方根误差为:RMSE=0.13931'); hold off

%若x1=37.25,x2=41.75,x3=44.5时,y的数据缺失,则可用得得出的拟合曲线来计算z=0.16599*x^2-13.387*x+271.62 x1=37.25,x2=41.75,x3=44.5;

z1=0.16599*x1^2-13.387*x1+271.62; z2=0.16599*x2^2-13.387*x2+271.62; z3=0.16599*x3^2-13.387*x3+271.62;

%计算可得到z1=3.3257,z2=2.0437,z3=4.6002.此例说明数据缺失时可先观察数据,拟合出多项式曲线,再求出缺失的数据。

附录二(多元线性回归模型matlab程序): clear;

data1=xlsread('H:\\data.xls'); %做出散点图 figure(1)

scatter3(data1(:,6),data1(:,7),data1(:,8),'r.'); x=[ones(262,1),data1(:,6),data1(:,7)]; y=data1(:,8);

[b,bint,r,rint,stats]=regress(y,x);

10

xlabel('SO2(X1)'); ylabel('NO2(X2)'); zlabel('PM10(Y)'); text(0.1,0.06,0.2,'回归关系式为:Y=0.03069-0.023695*X1+0.93619*X2','color','b'); title('PM10(Y)和SO2(X1)、NO2(X2)的关系','color','m'); %做残差分析图 figure(2)

rcoplot(r,rint);

xlabel('数据');ylabel('残差'); title('残差绘制图'); %补缺失数据

x1=[1 0.055 0.025]; y1=x1*b;

x2=[1 0.110 0.045]; y2=x2*b;

%y1=0.052792;y2=0.070212.

附录三(t检验法matlab程序): clear;

load H:\\data.txt; load H:\\data1.txt; s=sum(data(:,7),1)/53;

alpha=0.05;n=44;T=1.6802;y=1;a=1; stem(data(:,7));%观察异常值.

%观察异常值.可得到异常值为第6,9,13,23,26,29,35,36,45,53行. %把不是异常的个体看成一个整体data1,异常个体看成data2

data2=[1.004571;0.888936;0.77689;0.856265;0.79843;0.935673;0.630218;0.812906;0.101234];

aver=sum(data1(:,7),1)/44;

s=sqrt(sum((data1(:,7)-aver).^2,1)/44); for y=1:9

K(y,1)=abs(data2(y,1)-aver)./s; if(K(y,1)>T) H(a,1)=y; a=a+1; end end

附录四(三种插值法修正异常值程序): clear;

load H:\\data1.txt;

x0=[1,2,3,4,5,7,8,10,11,12,14,15,16,17,18,19,20,21,22,24,25,...

11

27,28,30,31,32,33,34,35,37,38,39,40,41,42,43,44,46,47,48,49,50,51,52];

y0=[ 0.442955 0.39876 0.37345 0.437790 0.44321 0.45321 0.54312 0.52145 0.34582 0.343307...

0.475664 0.423589 0.432951 0.441246 0.421128 0.416297 0.435372 0.394432 0.428593...

0.425061 0.461622 0.529131 0.460915 0.468112 0.523575 0.490494 0.472183 0.483644...

0.456781 0.425717 0.431464 0.432782 0.385745 0.388722 0.401138 0.385566 0.423361 0.401917...

0.443387 0.445423 0.573121 0.436781 0.447899 0.501123]; x=0:0.5:52;

y1=interp1(x0,y0,x);

y2=interp1(x0,y0,x,'spline');

pp1=csape(x0,y0); y3=ppval(pp1,x); y6=interp1(x0,y0,x,'pchip');

y5=interp1(x0,y0,53,'spline','extrap'); y4=interp1(x0,y0,53,'linear','extrap'); y7=interp1(x0,y0,53,'pchip','extrap');

subplot(2,2,1), plot(x0,y0,'+',x,y1), title('Piecewise linear'); subplot(2,2,2), plot(x0,y0,'+',x,y2), title('Spline'); subplot(2,2,3), plot(x0,y0,'+',x,y6), title('pchip'); y1=y1'; y2=y2'; y3=y3'; y6=y6';

% x=53时,y4=0.55435,y5=0.28292,y7=0.4689

附录五(修正后的值作t检验的程序): clear;

load H:\\data1.txt;

alpha=0.05;n=44;T=1.6802;y=1;a=1;

%观察异常值.可得到异常值为第6,9,13,23,26,29,36,45,53行. %把不是异常的个体看成一个整体data1,异常个体看成data3 %用线性插值

data3=[0.44821;0.53229;0.40949;0.42683;0.49538;0.46451;0.28125;0.41264;0.55435];

aver=sum(data1(:,7),1)/44;

s=sqrt(sum((data1(:,7)-aver).^2,1)/44); for y=1:9

K1(y,1)=abs(data3(y,1)-aver)./s; if(K1(y,1)>T)

12

H1(a,1)=y; a=a+1; end end

%用三次样条插值 b=1;

data4=[0.42682;0.59417;0.43222;0.43262;0.51929;0.43251;0.43327;0.41015;0.28295]; for y=1:9

K2(y,1)=abs(data4(y,1)-aver)./s; if(K2(y,1)>T) H2(b,1)=y; b=b+1; end end

%用分段三次Hermite插值 c=1;

data5=[0.44689;0.53794;0.40949;0.42683;0.50419;0.46264;0.43618;0.41264;0.4689]; for y=1:9

K3(y,1)=abs(data5(y,1)-aver)./s; if(K3(y,1)>T) H3(c,1)=y; c=c+1; end end

附表一(多元线性回归模型使用的数据):

城市名年 月 日 点位代点位

名SO2 NO2 称 码 称

A城 2004 1

2 101 1 0.116 0.074 A城 2004 1 3 101 1 0.120 0.078 A城 2004 1 4 101 1 0.062 0.053 A城 2004 1 5 101 1 0.050 0.042 A城 2004 1 6 101 1 0.131 0.061 A城 2004 1 7 101 1 0.071 0.035 A城 2004 1 8 101 1 0.048 0.035 A城 2004 1 9 101 1 0.045 0.035 A城 2004 1 11 101 1 0.104 0.050 A城 2004 1 12 101 1 0.150 0.050 A城 2004

1

14

101

1

0.075

0.051

13

PM10 0.074 0.075 0.048 0.021 0.054 0.025 0.012 0.011 0.032 0.037 0.065

A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 A城 2004 1 15 1 16 1 17 1 18 1 20 1 21 1 22 1 23 1 24 1 25 1 26 1 31 2 1 2 2 2 3 2 6 2 7 2 8 2 11 2 12 2 14 2 15 2 17 2 18 2 19 2 20 2 21 2 22 2 23 2 25 2 26 2 27 2 28 2 29 3 1 3 2 3 3 3 5 3 6 3 7 3 11 3 12 3 16 3 17

14

101

1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 101 1 0.025 0.028 0.017 0.028 0.017 0.026 0.030 0.030 0.057 0.030 0.053 0.017 0.020 0.023 0.057 0.017 0.040 0.022 0.031 0.031 0.036 0.035 0.052 0.039 0.033 0.031 0.065 0.038 0.057 0.047 0.061 0.050 0.029 0.045 0.037 0.052 0.044 0.046 0.028 0.038 0.032 0.035 0.038 0.043 0.039 0.046 0.027 0.042 0.030 0.045 0.031 0.029 0.027 0.025 0.065 0.039 0.038 0.034 0.030 0.036 0.036 0.035 0.038 0.044 0.099 0.044 0.039 0.018 0.100 0.037 0.078 0.043 0.118 0.053 0.135 0.048 0.080 0.041 0.102 0.056 0.045 0.023 0.071 0.038 0.095 0.051 0.064 0.021 0.032 0.037 0.052 0.077 0.076 0.062 0.064 0.071 0.052 0.056 0.073 0.072 0.084 0.082 0.101 0.106 0.090 0.095 0.095 0.089 0.075 0.063 0.061 0.078 0.089 0.053 0.067 0.097 0.053 0.109 0.098 0.075 0.080 0.028 0.048 0.077 0.080 0.076 0.059 0.079 0.061 0.070 0.081 0.036


缺失数据地补充及异常数据地修正 - 图文(3).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:2018年元旦主持词

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: