t?x1?x2ss?n1n22122 (6)
服从自由度为df的t分布。其中
2?s12?s2?n?n?12??2 (7) df??2222?s1??s2??n??n?12??????n1?1??n2?1?按显著性水平??0.05进行计算,将计算所得到的t值与t分布表中临界值比较,得到两组评酒员对红葡萄酒各项评价结果的平均值显著性差异如表3-1所示。
表3-1: 红葡萄酒t检验结果一览表 2评价指标 组别 t检验值 外观分析 澄清度 色调 一组 二组 一组 二组 -0.5 1.8 29 2.045 N 纯正度 一二组 组 1.3 35 2.032 N 52 2.008 N 纯正度 一组 二组 1.5 43 2.018 N 香气分析 浓度 一组 二组 1.1 46 2.015 N 平衡整体评价 一二组 组 1.2 35 2.032 N 质量 一组 二组 0.8 37 2.027 N 总分 一二组 组 2.8 41 2.020 Y ?df? (t分布自由度) t0.025?df? 均值是否有显著性差异 评价指标 组别 t检验值 口感分析 浓度 持久性 一二一二组 组 组 组 1.5 1.7 45 2.016 N 34 2.034 N 质量 一二组 组 1.1 46 2.015 N ?df? (t分布自由度) t0.025?df? 均值是否有显著性差异 通过观察上述表格分析可得,两组评酒员对红葡萄酒进行平均值显著性分析时,可以得到出总分外,其余各项均无显著差异。同理依据上述方法可以得到两组评酒员的白葡萄酒的评价结果的平均值的显著差异,如表3-2所示:
表3-2: 白葡萄酒t检验结果一览表 评价指标 外观分析 澄清度 色调 纯正度 香气分析 浓度 质量 6
组别 t检验值 一组 二组 -1.0 28 2.048 N 纯正度 一二组 组 -5.0 43 2.018 Y 一组 二组 -0.3 47 2.014 N 口感分析 浓度 持久性 一二一二组 组 组 组 -2.0 -3.3 54 2.006 N 45 2.016 Y 一组 二组 0.1 54 2.006 N 质量 一二组 组 -4.4 48 2.013 Y 一组 二组 -0.1 54 2.006 N 平衡整体评价 一二组 组 -3.0 49 2.012 Y 一组 二组 -0.3 54 2.006 N 总分 一二组 组 -2.4 47 2.014 Y ?df? (t分布自由度) t0.025?df? 均值是否有显著性差异 评价指标 组别 t检验值 ?df? (t分布自由度) t0.025?df? 均值是否有显著性差异 根据上述结果,可以得到两组评酒员对白葡萄酒的外观分析与香气分析的评价平均值不存在显著性差异,口感浓度分析的评价平均值不存在显著性差异,口感分析的其他指标、平衡整体及总分的评价平均值存在显著性差异。
综上所述由于第二组品酒师的评价结果的方差均小于第一组品酒师的评价结果的方差,所以第二组品酒师的评价精确度比第一组品酒师的评价结果更高,故认定第二组品酒师的评价结果更可信。
5.2酿酒葡萄分级
5.2.1选取葡萄分级指标
葡萄的理化指标直接影响了葡萄酒的质量,因此我们可以通过分析葡萄的理化指标分别和葡萄酒的总分(由表1-1可得)和各分项之间的相关性,综合得到对葡萄分级最有贡献的葡萄理化指标,即分级指标,将葡萄的各个样品以分级指标为依据进行聚类分析就可以对葡萄进行分级。
依据第一问的葡萄酒质量的分析结果,我们选取第二组评酒员的评价结果作为葡萄酒质量的参考依据。对于附录2所给的酿酒红葡萄的理化指标,如果理化指标进行多次测量,我们取其平均值作为实验数据,然后我们借助统计学软件SPSS7.1,对葡萄酒总分与酿酒葡萄各理化指标(含一级和二级指标)进行相关性分析,得到红葡萄酒的总分与红葡萄的理化指标的相关系数矩阵表,见附录2(白葡萄酒和其他分项相关系数矩阵表,由于篇幅所限略)。
为了兼顾研究的方便与数据的精确,我们选取合适的相关系数临界值,由附录2得到蛋白质、自由基、总酚、葡萄总黄酮、PH值及a*、C1、c2这些理化指标 对红葡萄酒的总分具有显著的相关性;为了保证研究的准确性,降低偶然性,我们将红葡萄酒总分的四部分,外观,香气,口感,平衡整体分别与葡萄的理化指标进行相关性分析,适当的选取相关系数临界值,得到自由基、a*、c2对红葡萄酒外观有显著相关性;得到自由基、葡萄总黄酮、顺式白藜芦醇对红葡萄酒香气有显著相关性;得到总酚、葡萄总黄酮及a*、C1、c2、c3对红葡萄酒口感有显著相关性;得到蛋白质和葡萄总黄酮对红葡萄酒平衡/整体相关性有显著相关性。如图2-1。
7
红葡萄酒质量 外观分析 香气分析 口感分析 平衡/整体 总分 蛋白质 a* C2 自由基 葡萄总黄酮 顺式白藜芦醇 总 酚 葡萄总黄酮 a* C1 C2 C3 蛋白质 葡萄总黄酮 蛋白质 自由基 总酚 葡萄总黄酮 PH值 a* C1 C2
图2-1 红葡萄酒质量与酿酒葡萄各理化指标相关图
综合考虑总分和各分项分别与葡萄有显著相关性的理化指标,将既在分项里面出现又在总分里面出现的理化指标,作为葡萄的分级指标,即蛋白质、自由基、总酚、葡萄总黄酮、a*、C1、c2。
同理,我们可以得到白葡萄酒总分与酿酒葡萄理化指标的相关系数矩阵表示,选取合适的相关系数临界值后,得到苏氨酸、总糖、可溶性固形物、b*、c1对白葡萄酒的总分具有显著相关性;然后分别分析酿酒葡萄的各个理化指标与白葡萄酒外观,香气,平衡整体的相关性,适当的选取相关系数的临界值,得到可溶性固形物、干物质质量、b*对白葡萄酒外观有显著相关性,得到苏氨酸、酒石酸、自由基对白葡萄酒香气有显著相关性,得到苏氨酸、可滴定酸、C1对白葡萄酒口感有显著相关性;得到酒石酸、可溶性固形物、果穗质量、b*、C1对白葡萄酒平衡/整体有显著相关性。如图2-2。
8
白葡萄酒质量 外观分析 香气分析 口感分析 平衡/整体 总分 可溶性固形物 干物质质量 b* 苏氨酸 酒石酸 自由基 苏氨酸 可滴定酸 C1 酒石酸 可溶性固形物 果穗质量 b* c1 苏氨酸 总糖 可溶性固形物 b* c1 图2-2 白葡萄酒质量与酿酒葡萄各理化指标相关图
综合考虑白葡萄酒总分和各分项分别与葡萄有显著相关性的理化指标,将既在分项里面出现又在总分里面出现的理化指标找出,作为白葡萄的分级指标,即苏氨酸、酒石酸、可溶性固形物、果穗质量、b*、C1。
5.2.2 对理化指标进行聚类分析
根据5.2.1,我们得到了红葡萄酒和白葡萄酒的分级指标,下面我们将结合这些分级指标运用聚类分析?4?对葡萄进行分级。我们将葡萄样品的分级指标进行数据整理后得出27种红葡萄与其分级指标的特征表与28种白葡萄与其分级指标的特征表(见附录3),、然后对表中数据进行归一化处理,剔除对分级贡献小的特征值,使含量高、最高或低、最低的聚类分级。
下面我们先对红葡萄酒的酿酒葡萄进行分级讨论,设:
序号 分级指标 样本特征值 1 蛋 白 质 X11 X21 X31???X27,1
2 自 由 基 X12 X22 X32???X27,2 3 总 酚 X13 X23 X33???X27,3 4 葡萄总黄酮 X14 X24 X34???X27,4 5 a* X15 X25 X35??? X27,5 6 C1 X16 X26 X36???X27,6 7 c2 X17 X27 X37???X27,7
其中,Xij 中i为样本数,j为分级指标序号。 1.归一特征表中数据
将上述特征表进行矩阵分析,将特征值按公式(8)作归一化处理:
9
?Xik?/Xik? (8) Xkmax
/上式(8)中?Xik?为归一化葡萄理化指标特征数据,Xik为原始葡萄理化指标特征数据,
Xkmax?max?X1k,X2k??Xnk?为K行中贡献最大的特征值。
2. 确定葡萄酒的模糊相似矩阵R
//根据任意两葡萄样品间归一化数据值?Xik?和?Xjk?用夹角余弦法计算(公式9)样
品间相似性系数值rij组成的27种红葡萄酒的模糊相似矩阵R,计算过程matlab代码和结果见附录四:
rij??Xk?17/ik?X/jk?X??X/2ikk?1k?177 (9)
/2jk
3. 基于最大树法的聚类分析
根据模糊相似矩阵R的元素相似系数值用最大树法作聚类分析。最大树法的构思是以所有被分级的样品为顶点,当模糊相似矩阵R的元素相似系数值rij不等于0时,将顶点i和顶点j用直线连接,并标记该元素的相似系数值rij。则构成一棵大树状的特殊图形,故称最大树法。
最大树法的具体画法:先画出顶点集中处的某个顶点i,然后按元素相似系数值rij的大小,从大到小的顺序低,次连接,标上rij值,连接时要求不产生回路,直到所有样品接通为止,可得一棵最大树,如图3-1红葡萄分级大树图。
图3-1 红葡萄分级大树图
10