希望找出使用次数与增大容积之间的函数关系.实验数据如表3.3。 使用次数(x) 2 增大容积(y) 6.42 使用次数(x) 10 增大容积(y) 10.49 3 8.2 11 10.59 4 9.58 12 10.6 5 9.5 13 10.8 6 9.7 14 10.6 7 10 15 10.9 8 9.93 16 10.76 9 9.99 (1)建立非线性回归模型1/y=a+b/x;
(2)预测钢包使用x0=17次后增大的容积y0; (3)计算回归模型参数的95%的置信区间。 clear x=[2:16];
y=[6.42,8.2,9.58,9.5,9.7,10,9.93,9.99,10.49,10.59,10.6,10.8,10.6,10.9,10.76]; %画散点图以确定选用图2-4曲线拟合
%plot(x,y) %从图形看建立非线性双曲线回归模型 b0=[0.084,0.1436]; % 初始参数值 fun=inline('x./(b(1)*x+b(2))','b','x'); [beta,r,J]=nlinfit(x,y,fun,b0);
beta % 输出最佳参数 y1=x./(0.0845*x+0.1152); % 拟合曲线 % figur(2)
plot(x,y,'*',x,y1,'-or')
legend('原始数据','拟合曲线') %求a,b值
%[a,b]=solve('6.42*(2*a+b)=2','10.76*(16*a+b)=16')
%预测钢包使用17次后增大的容积,可在执行上面的程序中,继续输入命令 %ypred=nlpredci(fun,17,beta,r,J)
%求回归模型参数的95%的置信区间,只要继续添加程序 %ci = nlparci(beta,r,J)
4.某销售公司将库存占用资金情况、广告投入的费用、员工薪酬以及销售额等方面的数据作了汇总见表3.4。该公司试图根据这些数据找到销售额与其他变量之间的关系,以便进行销售额预测并为工作决策提供参考依据。(1)建立销售额的回归模型;(2)如果未来某月库存资金额为150万元,广告投入预算为45万元,员工薪酬总额为27万元,试根据建立的回
归模型预测该月的销售额。
月份 库存资金额(x1) 广告投入(x2) 1 75.2 30.6 2 77.6 31.3 3 80.7 33.9 4 76 29.6 5 79.5 32.5 6 81.8 27.9 7 98.3 24.8 8 67.7 23.6 9 74 33.9 10 151 27.7 11 90.8 45.5 12 102.3 42.6 13 115.6 40 14 125 45.8 15 137.8 51.7 16 175.6 67.2 17 155.2 65 18 174.3 65.4 clear
A=[75.2 30.6 21.1 1090.4 77.6 31.3 21.4 1133 80.7 33.9 22.9 1242.1 76 29.6 21.4 1003.2 79.5 32.5 21.5 1283.2 81.8 27.9 21.7 1012.2 98.3 24.8 21.5 1098.8 67.7 23.6 21 826.3 74 33.9 22.4 1003.3 151 27.7 24.7 1554.6 90.8 45.5 23.2 1199 102.3 42.6 24.3 1483.1 115.6 40 23.1 1407.1 125 45.8 29.1 1551.3 137.8 51.7 24.6 1601.2 175.6 67.2 27.5 2311.7 155.2 65 26.5 2126.7 174.3 65.4 26.8 2256.5]; [m,n]=size(A);
subplot(3,1,1),plot(A(:,1),A(:,4),'+'), xlabel('x1(库存资金额)') ylabel('y(销售额)')
subplot(3,1,2),plot(A(:,2),A(:,4),'*'), xlabel('x2(广告投入)') ylabel('y(销售额)')
subplot(3,1,3),plot(A(:,3),A(:,4),'x'), xlabel('x3(员工薪酬)')
员工薪酬总额(x3) 销售额(y) 21.1 1090.4 21.4 1133 22.9 1242.1 21.4 1003.2 21.5 1283.2 21.7 1012.2 21.5 1098.8 21 826.3 22.4 1003.3 24.7 1554.6 23.2 1199 24.3 1483.1 23.1 1407.1 29.1 1551.3 24.6 1601.2 27.5 2311.7 26.5 2126.7 26.8 2256.5 ylabel('y(销售额)')
% 调用命令regress建立三元线性回归模型 x=[ones(m,1), A(:,1), A(:,2), A(:,3)]; y=A(:,4)
[b,bint,r,rint,stats]=regress(y,x);
b,bint,stats, % 输出结果 %残差与置信区间图 %rcoplot(r,rint)
三、实习题
1.以家庭为单位,某种商品年需求量与该商品价格之间的一组调查数据见下表3.5所示。
5 2 2 2.3 2.5 2.6 2.8 3 3.3 3.5 价格x(元) 5 3.5 3 2.7 2.4 2.5 2 1.5 1.2 1.2 需求量(kg) ????x。 ???(1)求经验回归方程y01(2)检验线性关系的显著性(?=0.05,采用F检验)。
2.某省1978-1989消费费基金、国民收入使用额为67(十亿元),平均人口为58(百万人),当显著性水平?=0.05时,试估计1990年消费基金的预测区间。
年份 消费费基金y 国民收入使用额x1 平均人口数x2 1978 9.0 12.1 48.20 1979 9.5 12.9 48.90 1980 10.0 16.8 49.54 1981 10.6 14.8 50.25 1982 12.4 16.4 51.02 1983 16.2 20.9 51.84 1984 17.7 24.2 52.76 1985 20.1 28.1 56.39 1986 21.8 30.1 54.55 1987 25.3 35.8 55.35 1988 31.3 48.5 56.16 1989 36.0 54.8 56.98
实习四 判别分析
一、实验目的
掌握MATLAB判别分析的方法与计算步骤。 二、实例
1.蠓是一种昆虫,分为很多类型,其中有一种名为Af,是能传播花粉的益虫;另一种名为Apf,是会传播疾病的害虫,这两种类型的蠓在形态上十分相似,很难区别。现测得6只Apf和9只Af蠓虫的触角长度和翅膀长度数据Apf:(1.14,1.78), (1.18,1.96), (1.20,1.86), (1.26,2.00), (1.28,2.00), (1.30,1.96) ;Af:(1.24,1.72), (1.36,1.74), (1.38,1.64), (1.38,1.82), (1.38,1.90), (1.40,1.70), (1.48,1.82),(1.54,1.82), (1.56,2.08).
若两类蠓虫协方差矩阵相等,试判别以下的三个蠓虫属于哪一类?
(1.24,1.8),(1.28,1.84),(1.4,2.04)
%方法一
clear
apf=[1.14,1.78;1.18,1.96;1.20,1.86;1.26,2.;1.28,2;1.30,1.96]; %总体apf
af=[1.24,1.72;1.36,1.74;1.38,1.64;1.38,1.82;1.38,1.90;1.40,1.70;1.48,1.82;1.54,1.82;1.56,2.08]; %总体af
x=[1.24,1.8;1.28,1.84; 1.4,2.04]; % 输入原始待判数据 n1=size(apf,1); %总体apf的样本容量 n2=size(af,1); %总体af的样本容量 m1=mean(apf); %总体apf 的均值向量 m2=mean(af); %总体af 的均值向量 s1=cov(apf); %总体apf 的协方差 s2=cov(af); %总体af 的协方差
s=((n1-1)*s1+(n2-1)*s2)/(n1+n2-2); %计算样本均值与协方差矩阵 for i=1:3
W(i)=(x(i,:)-1/2*(m1+m2))*inv(s)*(m1-m2)'; % 计算判别函数值 end
输出结果为: W =
2.1640 1.3568 1.9802 %方法二 clear
apf=[1.14,1.78;1.18,1.96;1.20,1.86;1.26,2.;1.28,2;1.30,1.96]; %总体apf
af=[1.24,1.72;1.36,1.74;1.38,1.64;1.38,1.82;1.38,1.90;1.40,1.70;1.48,1.82;1.54,1.82;1.56,2.08]; %总体af
training=[apf;af]; %合并两个总体形成训练集 n1=size(apf,1); %总体apf中样本的行数 n2=size(af,1); %总体af中样本的行数
group=[ones(1,n1), 2*ones(1,n2)]; %apf中样本与af中样本类属 x=[1.24,1.8;1.28,1.84; 1.4,2.04]; % 输入原始待判数据即sample class = classify(x, training,group) %判别分析
输出结果为: class= 1 1 1
2.假定两类总体的协方差矩阵不相等,重新判别上述三个蠓虫的类别。 clear
apf=[1.14,1.78; 1.18,1.96;1.20,1.86;1.26,2.;1.28,2;1.30,1.96];
af=[1.24,1.72;1.36,1.74;1.38,1.64;1.38,1.82;1.38,1.90;1.40,1.70;1.48,1.82;1.54,1.82;1.56,2.08]; x=[1.24,1.8;1.28,1.84;1.4,2.04]; % 输入原始数据 W=mahal(x,apf)-mahal(x,af) % 计算判别函数值 输出结果为: W =
1.7611 3.8812 3.6468
3.已知矩阵A给出的身体指标化验数据,对三个待判数(190,67,30,17),(315,100,35,19),(240,60,37,18)进行判别归类. clear
A=[260 75 40 18 310 122 30 21 320 64 39 17 200 72 34 17 310 60 35 18 260 59 37 11 240 87 45 18 190 40 27 15 360 88 28 26 170 65 39 17 225 65 34 16 295 100 36 12 270 110 39 24 170 65 37 16 270 65 32 21 205 130 34 23 210 82 31 17 380 114 36 21 190 69 27 15 280 67 37 18 240 55 42 10 200 46 45 15 210 38 36 17 260 55 34 20 250 117 21 20 280 65 30 23 260 110 29 20 200 107 28 20 200 76 40 17 295 73 33 21 225 130 36 11 200 76 39 20 240 114 38 18 210 125 26 17 280 94 26 11 310 103 32 18 170 64 31 14 190 60 33 17 330 112 21 11 270 76 33 13 295 55 30 16 345 127 24 20 190 60 34 16 270 125 24 21 250 62 22 16 280 81 20 18 280 120 32 18 260 59 21 19 310 119 25 15 240 62 32 20 225 100 34 30 270 57 31 8 280 69 29 20 345 120 36 18 250 67 31 14 370 70 30 20 360 107 25 23 260 135 39 29 280 40 37 17 250 117 36 16 ];
G1=A(:,1:4);G2=A(:,5:8);G3=A(:,9:12); %三类总体数据 x=[190 67 30 17;315 100 35 19;240 60 37 18]; %待判定的数据 m(1,:)=mean(G1);m(2,:)=mean(G2);m(3,:)=mean(G3);
s1=cov(G1);s2=cov(G2);s3=cov(G3); % 计算样本均值与协方差矩阵