68.1,74,74.6,71.2,72.1,66.3,65.3,66,78.2,68.8,61.6,68.3,68.8,72.6,65.7,69.9,74.5,65.4,72.6,75.8,72.2,71.6,77.1,71.5,68.2,72, 71.5
然后我们利用Matlab软件里的正态分布拟合函数进行曲线拟合,得出其正态分布的拟合曲线图为图一:
图一、正态分布拟合曲线图
从图中我们知道其曲线近似为一条直线,因此我们认为评酒员对红葡萄酒以及白葡萄酒的评分均值都服从正态分布。 2. T检验法模型的建立与求解
设?,?分别为第一组、第二组评酒员对各品种红葡萄酒的评分均值,且
?~N(?1,?12),?~N(?2,?22),其中?1,?2,?12,?22均未知。
(1) 作出统计假设H0:?1??2?H1:?1??2。 (2) 选取统计量
6
T????n1S1n1?n2S2n2n1?n2?222??~t(n1?n2?2)
11?n1n2
(3) 对于给定的显著性水平??0.05,我们利用Matlab软件进行计算求解。结果如下
表所示:
葡萄酒的品种 H值 P值 差异显著程度 第一组 第二组 第一组 第二组 红葡萄酒 红葡萄酒 白葡萄酒 白葡萄酒 0 1 0.9396 1.4077e-006 差异不显著 差异非常显著
H=0,表示接受原假设;H=1,表示接受背择假设。
由上表可知:红葡萄酒之间不存在显著性差异,白葡萄酒之间存在显著性差异。 4.1.2 可信度的判定
由于样本的置信区间与其可信度是呈负相关的,即置信区间越小,其可信度越大。我们利用Matlab软件求解得出第一组、第二组红葡萄酒和白葡萄酒的置信区间,见下表:
葡萄酒的置信区间
第一组 第二组 红葡萄酒的置信区间 [70.3377,75.7734] [69.6890,71.9607] 白葡萄酒的置信区间 [72.3342,76.1872] [75.3788,77.6855]
显然第二组的置信区间长度小于第一组,所以第二组评酒员的评价结果可信度更高。
7
4.2 问题二的模型建立与求解
主成分分析法是一种数学变换的方法, 它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分。依次类推,I个变量就有I个主成分。 1.计算相关系数矩阵
?r1p?r22?r2p?? (1) ?????rp2?rpp??
在(1)式中,rij(i,j?1,2,?,p)为原变量的xi与xj之间的相关系数,其计算公式为
?r11?r21R???????rp1r12
rij??(xk?1nki?xi)(xkj?xj)n?(xk?1n (2)
ki?xi)2?(xkj?xj)2k?1
因为R是实对称矩阵(即rij?rji),所以只需计算上三角元素或下三角元素即可。
2.计算特征值与特征向量
首先解特征方程?I?R?0,通常用雅可比法求出特征值?i(i?1,2,?,p),并使其按大小顺序排列,即?1??2????p?0。然后分别求出对应于特征值?i的特征向量
2ei(i?1,2,?,p)。这里要求ei=1,即?eij?1,其中eij表示向量ei的第j个分量。
j?1p3.计算主成分贡献率及累计贡献率
贡献率:第i个主成分方差在全部方差中所占的比重称为贡献率。这个值越大,表明第i个主成分综合信息的能力越强。
主成分Zi的贡献率为
8
?i??k?1p(i?1,2,?,p) (3)
k
累积贡献率:前k个主成分共有多大的综合能力,用这k个主成分的方差和在全部方差中所占的比重来描述,表明取前k个主成分基本包含了全部测量指标所具有信息的 百分率。
累计贡献率为
i????k?1k?1pk(i?1,2,?,p) (4)
k
一般取累计贡献率达85%~95%的特征值?1,?2,?,?m所对应的第一、第二,?,第
m(m?p)个主成分。
4.计算主成分载荷
主成分载荷是反映主成分与元变量之间的相互关联程度。 其计算公式为
lij?p(zi,xj)??ieij(i,j?1,2,?,p) (5)
于是Matlab软件求解,分别得出红葡萄与白葡萄所分的主成分、特征值、贡献率以及累计贡献率,结果见下表一及表二:
表一 红葡萄主成分的特征值、贡献率及累计贡献率 主成分 特征值 25.3328 0.904936 0.642733 0.0717938 0.0237808 0.0109601 贡献率/% 93.83% 03.35% 2.38% 0.27% 0.09% 0.04% 累计贡献率/% 93.83% 97.18% 99.56% 99.83% 99.92% 99.96% Z1 Z2 Z3 Z4 Z5 Z6
9
Z7 Z8 0.00684844 0.00376027 0.03% 0.01% 99.99% 100%
由上表可看出,主成分Z1所占的累计贡献率已高达93.83%(大于85%),故只需求出第一主成分Z1即可。
对于特征值 25.3328求出其特征向量e1,再用公式计算各变量x1,x2,x3,?,在主成分Z1上的载荷为H(i):
0.9351,0.9791,0.9611,0.9878,0.9830,0.9812,0.9920,0.9101,0.9958,0.9837,0.9873,0.9877,0.9828,0.8736,0.9924,0.9834,0.9837,0.9911,0.9925,0.9877,0.9661,0.9921,0.9981,0.9781,0.9866,0.7914,0.9420
第一主成分Z1与x1,x2,x3,?都呈现正相关性。 因此我们认为:
载荷H(i)=0.9981的x23(即果穗质量)与主成分Z1有极强的正相关。所以,我们根据x23的含量水平为葡萄进行排名:排名如下
样品编号 果穗质量/g 红葡萄样品26 793.47 红葡萄样品24 517.45 红葡萄样品5 515.46 红葡萄样品17 446.64 红葡萄样品20 307.14 红葡萄样品25 288.69 红葡萄样品27 282.09 红葡萄样品23 278.75 红葡萄样品10 255.44 红葡萄样品8 213.09 红葡萄样品14 209.11 红葡萄样品6 202.24 红葡萄样品18 196.01 红葡萄样品12 191.95 红葡萄样品9 186.62 红葡萄样品1 182.93 红葡萄样品11 177.83 红葡萄样品19 173.09 红葡萄样品13 159.97
10