实验三 回归分析

2020-06-19 09:31

实验三 回归分析

1.为了分析X射线的杀菌作用,用200千伏的X射线来照射细菌,每次照射6分钟用平板计数法估计尚存活的细菌数,照射次数记为 t,照射后的细菌数y如表1所示。

表1 X射线照射次数与残留细菌数

试求:①给出y与t的二次函数回归模型;②在同一坐标系内做出原始数据与拟合结果的散点图;③预测t=16时残留的细菌数;④根据问题实际意义,你认为选择多项式函数是否合适?⑤给出非线性回归模型,并预测照射16次后细菌残留数目。

解:(1)实验程序: t=1:15;

y=[352 211 197 160 142 106 104 60 56 38 36 32 21 19 15];

rstool(t',y','purequadratic')

结果如图1所示:

3503002502001501005004681012

图1

在Matlab工作区中输入命令:beta,rmse

beta =347.8967 -51.1394 1.9897 rmse =22.2649

所以y与t的二次回归模型函数:y?347.8967?51.1394t?1.9897t2 (2)画出同一坐标散点图,如图2所示,程序如下: [p,s]=polyfit(t,y,2); Y=polyconf(p,t,y); plot(t,y,'k+',t,Y,'r')

1

400350300250200150100500051015

图2 散点图

(3)当t=16时,计算程序如下: [p,s]=polyfit(t,y,2); Y=polyconf(p,16); 结果是:Y =39.0396

即说明预测残留的细菌数y=39.0396个;

(4)用二次函数计算出细菌残留数为39.0396,显然与实际不相符合。根据实际问题的意义可知:尽管二次多项式拟合效果较好,但是用于预测并不理想。因此,如何根据原始数据散点图的规律,选择适当的回归曲线是非常重要的,因此有必要研究非线性回归分析。

(5)由(2)散点图可知,可以假设将要拟合的的非线性模型为y?aeb/t对将要拟合的非线性模型y?aeb/t,建立的M-文件volum.m如下: function yhat=volum(beta,t) yhat=beta(1)*exp(beta(2).*t);

%输入数据 t=1:15;

y=[352 211 197 160 142 106 104 60 56 38 36 32 21 19 15]; beta0=[150,0]';

%求回归系数

[beta,r,J]=nlinfit(t',y','volum',beta0); beta

y=nlpredci('volum',16,beta,r,J)

y?400.0905e-0.2240t,得结果:beta =400.0905 -0.2240,y =11.1014,即回归模型为:

那么根据此模型我们可以知道:当t=16时,残留的细菌数y=11.1014,很显然这样的结果会更令人满意!

2

2.某销售公司将库存占用资金情况、广告投入的费用、员工薪酬以及销售额等方面的数据作了汇总(表 2),该公司试图根据这些数据找到销售额与其他变量之间的关系,以便进行销售额预测并为工作决策提供参考依据。(1)建立销售额的回归模型;(2)如果未来某月库存资金额为150万元,广告投入预算为45万元,员工薪酬总额为27万元,试根据建立的回归模型预测该月的销售额。

表2 库存资金额、广告投入、员工薪酬、销售额汇总表(单位:万元)

月份 库存资金额(x1) 广告投入(x2) 员工薪酬总额(x3) 销售额(y)

1 75.2 30.6 21.1 1090.4 2 77.6 31.3 21.4 1133.0 3 80.7 33.9 22.9 1242.1 4 76.0 29.6 21.4 1003.2 5 79.5 32.5 21.5 1283.2 6 81.8 27.9 21.7 1012.2 7 67.7 24.8 21.5 1098.8 8 98.3 23.6 21.0 826.3 9 74.0 33.9 22.4 1003.3 10 151.0 27.7 24.7 1554.6 11 90.8 45.5 23.2 1199.0 12 102.3 42.6 24.3 1483.1 13 115.6 40.0 23.1 1407.1 14 125.0 45.8 29.1 1551.3 15 137.8 51.7 24.6 1601.2 16 175.6 67.2 27.5 2311.7 17 155.2 65.0 26.5 2126.7 18 174.3 65.4 26.8 2256.5

解:首先,作出因变量与各自变量的样本散点图,如图3所示,程序如下:

x1=[75.2 77.6 80.7 76.0 79.5 81.8 67.7 98.3 74.0 151.0 90.8 102.3 115.6 125.0 137.8 175.6 155.2 174.3];

x2=[30.6 31.3 33.9 29.6 32.5 27.9 24.8 23.6 33.9 27.7 45.5 42.6 40.0 45.8 51.7 67.2 65.0 65.4];

x3=[21.1 21.4 22.9 21.4 21.5 21.7 21.5 21.0 22.4 24.7 23.2 24.3 23.1 29.1 24.6 27.5 26.5 26.8];

y=[1090.4 1133.0 1242.1 1003.2 1283.2 1012.2 1098.8 826.3 1003.3 1554.6 1199.0 1483.1 1407.1 1551.3 1601.2 2311.7 2126.7 2256.5]; subplot(1,3,1),plot(x1,y,'g*'); subplot(1,3,2),plot(x2,y,'k+'); subplot(1,3,3),plot(x3,y,'ro');

3

2400220020001800160014001200100080024002200200018001600140012001000800240022002000180016001400120010008002001002000501002530

图3 因变量y与各自变量的样本散点图

从图上可以看出这些点大致分布在一条直线旁边,因此有较好的线性关系,

????x???x???x,建立M-文件输???可以采用线性回归。设回归方程为:y0112233入如下程序:

x1=[75.2 77.6 80.7 76.0 79.5 81.8 67.7 98.3 74.0 151.0 90.8 102.3 115.6 125.0 137.8 175.6 155.2 174.3];

x2=[30.6 31.3 33.9 29.6 32.5 27.9 24.8 23.6 33.9 27.7 45.5 42.6 40.0 45.8 51.7 67.2 65.0 65.4];

x3=[21.1 21.4 22.9 21.4 21.5 21.7 21.5 21.0 22.4 24.7 23.2 24.3 23.1 29.1 24.6 27.5 26.5 26.8];

y=[1090.4 1133.0 1242.1 1003.2 1283.2 1012.2 1098.8 826.3 1003.3 1554.6 1199.0 1483.1 1407.1 1551.3 1601.2 2311.7 2126.7 2256.5]; n=18;m=3;

x=[ones(n,1),x1',x2',x3'];

[b,bint,r,rint,s]=regress(y',x,0.05); b,bint,r,rint,s

运行后即得到结果如表3所示

4

表3 对初步回归模型的计算结果

回归系数 回归系数的估计值 -53.9075 5.7252 15.2879 9.5698 回归系数的置信区间 [-1011.2,903.4] [2.0,9.4] [6.4,24.2] [-44.9,64.1] ?0 ?1 ?2 ?3 R2?1,F?59,p?0.0001,s2?17271

残差列向量r =[44.0394 59.3264 96.5750 -35.3239 179.3461 -36.4116 180.2202 -244.3408 -99.0812 84.1521 -184.5600 67.5082 -33.4048 -89.1104 -159.6274 69.7451 44.7425 56.2050]T

对应残差的(1??)置信区间rint如下:

[-228.8318,316.9105]、 [-214.8092,333.4620] [-173.5015,366.6515]、 [-311.2066,240.5589] [-75.9312,434.6233]、 [-313.1813, 240.3581] [-69.6357,430.0762]、 [-449.7576,-38.9240] [-365.7729,167.6105]、 [-69.8815,238.1857] [-428.0384,58.9185]、 [-208.3399,343.3563] [-312.3682, 245.5587]、[-199.0870,20.8662] [-415.9094,96.6547]、 [-172.6973,312.1875] [-207.2697,296.7547]、 [-186.8695,299.2794]。

??-53.9075?5.7252x1?15.2879x2?9.5698x3,因此得到初步的回归方程为:y当未来某月库存资金额为150万元,广告投入预算为45万元,员工薪酬总额为

27万元,那么根据所建立的回归模型可以预测出该月的销售额为1751.2万元。

3.葛洲坝机组发电耗水率的主要影响因素为库水位、出库流量。现从数据库中将 2005年10月某天15时-16时06分范围内的出库流量、库水位对应的耗水率读取处理,数据如表4所示,试利用多元线性回归分析方法建立耗水率与出库流量、库水位的模型。(表4数据来源:余波,多元线性回归分析在机组发电耗水率中的应用,计算机与现代化,2008(2))

5


实验三 回归分析.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:08~09高物A卷

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: