葡萄酒的评价模型
摘要
如今,葡萄酒被越来越多的人所热爱,不仅因为它博大精深的酒文化及其上等的品质,更多的是由于葡萄酒的营养价值。葡萄酒质量的鉴别主要靠感官分析和理化指标分析的方法来确定,本文主要讨论了葡萄酒质量与酿酒葡萄理化指标、葡萄酒理化指标之间的联系,分析了葡萄酒人工品评中存在的不足,建立了科学的葡萄酒质量评价模型,对葡萄酒市场的稳定发展以及更好地酿造出高质量的葡萄酒有着实际的应用价值。
对于问题一,本文将两组品酒员的打分结果看作两个配对样本,采取了配对样本T检验的方法,分别对红葡萄酒与白葡萄酒的打分情况进行显著性差异分析。根据结果可知,红、白葡萄酒的打分结果均存在显著性差异,且第二组品酒员打分结果的系统误差更小,更为可信。
对于问题二,本文首先用置信区间法,将品酒员的打分结果进行转化处理,得到新的葡萄酒评分。接着,综合酿酒葡萄的理化指标并运用聚类分析法,分别以红葡萄酒与白葡萄酒的酒样作为研究对象,各项指标作为变量,对酒样进行分级。再通过酒样类别推出酿酒葡萄的分级情况。
对于问题三,为了探寻酿酒葡萄理化指标与葡萄酒理化指标之间的联系,本文运用典型相关的分析方法,将酿酒葡萄的理化指标作为影响因子,试图找到葡萄酒理化指标对应的少量主要因子。运用SAS软件对相应的因子进行回归分析,得出相应因子的系数方程,以此判断因子的正负相关性,从而建立酿酒葡萄与葡萄酒理化指标之间的关系。
对于问题四,分析了酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。酿酒葡萄的理化指标是葡萄酒的理化指标的主要影响因素,在一定程度上,两个指标对葡萄酒质量的影响可以看作是相似甚至相等,于是本文选取葡萄酒的理化指标进行分析。接着,本文将乙醇与花色苷、单宁、酚类的比值作为新的理化指标,重新建立葡萄酒质量评价体系,进而分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。结果证明,仅仅用酿酒葡萄和葡萄酒的理化指标,并不能评价葡萄酒的质量。
关键字:葡萄酒 理化指标 配对T检验 聚类分析 典型相关 多元回归
1
一、问题重述
葡萄酒的评价
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:
1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4. 分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄
和葡萄酒的理化指标来评价葡萄酒的质量?
二、符号说明与模型假设
2.1符号说明
xij 品酒员i 对酒样j 的评价 第j种酒样的第i项指标在标准化后的数值 乙醇/花色苷 乙醇/单宁 乙醇/总酚 酒总黄酮 白藜芦醇 DPPH半抑制体积 L*(D65) a*(D65) 2
? Aij x1 x2 x3 x4 x5 x6 x7 x8
x9 y 2.2模型假设
b*(D65) 质量 1.品酒员不带地区主观性,评判公正。
2.葡萄酒样品的品评得分合理、客观、全面。
2.葡萄酒的制作过程、制作方法不会影响葡萄酒的质量。
三、问题分析
3.1问题一:
品评往往受到评酒人员的嗜好、习惯、情绪、年龄、经验等因素的影响,因为评定常有一定程度的主观性和不确定性,这是评分的可靠性受到影响。问题要求对两组品酒员的打分情况进行显著性差异分析,并得出哪一组的结果更为可信。首先,我们需要对题给数据进行处理简化,计算每一个酒品样本的平均得分,在一定程度下减小了主观打分的误差。接着,考虑运用配对样本T检验方法,得到较为直观的分析结果。
3.2问题二:
题目要求根据酿酒葡萄的理化指标和葡萄的质量来对葡萄进行分级。一方面,针对问题一用置信区间法得出的对葡萄酒的评分,我们将其作为葡萄酒的质量指标值;另一方面,由于葡萄本身的理化指标过多且复杂,每项理化指标对于葡萄生产成葡萄酒的影响也过于繁杂,故我们利用葡萄酒的理化指标来对葡萄进行分类。
在进行聚类分析时,我们以酒样作为研究对象,各项指标作为变量对酒样进行聚类分析,再通过酒样得到的类别大致推出葡萄的分级情况,在此需说明的是红、白葡萄酒因葡萄品种不同分开讨论。 3.3问题三:
葡萄酒的酒酿过程是一个复杂的化学物理过程,葡萄与葡萄酒的理化指标在一定程度上显示了这一复杂的变化;但由于数据过于庞大繁杂,我们需要建立适当的模型来进行数据挖掘,从而分析理化指标之间的联系。
首先,我们要对理化指标进行简化处理,并通过调阅文献,对各理化指标进行全面的理解。这样的准备工作有助于我们对理化指标的相互关系作出初步的判断。随后,通过建立模型对理化指标进行定量分析,将得到的结果与实际物化性质进行比较分析,得到全面、科学的结论。理化指标的相关性分析可采用典型相关性模型。
3
3.4问题四:
问题四需要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,而题目中所说“酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系”,恰恰表明酿酒葡萄的理化指标是葡萄酒的理化指标的主要影响因素,在一定程度上两个指标对葡萄酒质量的影响可以看做是相似甚至相等,于是可以选取指标较少的葡萄酒,以他的理化指标来分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。根据化学知识,花色苷、单宁、酚类均溶于乙醇,我们以乙醇/花色苷,乙醇/单宁,乙醇/总酚作为新的指标,处理数据。
对于多个影响因素,本文以红葡萄酒作为实验对象,白葡萄酒作为检验对象,并将第一问中品酒员对酒评分的平均数作为某种葡萄酒的真实质量,采用多元线性回归方程,来线性描绘各指标对葡萄酒质量的影响,并通过图形检验及白葡萄酒检验,来判别上述回归方程的准确性。其中白葡萄酒的检验即为以多元回归方程估计28种葡萄酒的估计质量,并与真实质量相比较。对于第二问论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,本文以指标影响排名(即估计质量排名)与真实质量排名相比较,若在一定的误差允许范围内,排名有所波动,可以认为能够用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,反之,若误差较大,则不可以。
四、模型的建立与求解
4.1问题一
4.1.1利用T检验[1]分析两组品酒员的评价差异性
对于问题一,要求对两组品酒员的打分情况进行显著性差异分析。本文考虑运用多元统计学里的配对样本T检验方法。
4.1.1.1配对T检验的基本实现思路
配对样本是指对同一样本进行两次测试所获得的两组数据,或对两个完全相同的样本在不同条件下进行测试所得的两组数据。根据题给数据,两组品酒员均对27个红葡萄酒样本、28个白葡萄酒样本进行了打分评估,故可以将两组品酒员的打分结果看作两个配对样本(红葡萄酒与白葡萄酒),且样本打分的两个总体服从正态分布。
两个独立样本的T检验,是根据样本数据,对两个配对样本来源总体的均值是否有显著性差异进行推断。因此,本文先根据附件一提供的品酒员对葡萄酒的评价结果,将每位品酒员对每种酒样的各项指标的得分相加,即可得到两组品酒员对红葡萄酒和白葡萄酒的评价总分及平均分(详见附录1)。
4
在进行配对T检验分析显著性差异的时候,我们先引进一个新的随机变量Y?X1?X2对应的样本值为(y1,y2,...yn),其中,yi?x1i?x2i(i?1,2,...,n)。
这样,检验的问题就转化为单样本t检验问题(即转化为检验Y的均值是否与0有显著差异)。
第二步,建立零假设,H0第三步,构造t统计量
:?Y?0
yt?~t(n?1)
sy/n?1_第四步,运用Spss自动计算t值和对应的P值。 第五步,作出判断:
若P值<显著水平?,则拒绝零假设,即认为两总体均值存在显著差异。 若P值>显著水平?,则不能拒绝零假设,即认为两总体均值不存在显著
差异。
4.1.1.2 模型的求解
接下来我们用两组品酒员对两种葡萄酒样品(包括27种红葡萄酒和28种白葡萄酒)的平均分通过SPSS软件做显著性分析。可得如下: (1)红葡萄酒: 成对样本统计量 对 1 第一组平均分 第二组平均分 均值 73.056 70.515 N 27 27 标准差 7.3426 3.9780 均值的标准误 1.4131 .7656
成对样本相关系数 对 1 第一组平均分 & 第二组平均分 N 27 相关系数 .700 Sig. .000 成对样本检验 成对差分 差分的 95% 置信均值的均值 标准差 标准误 下限 上限 t df 区间 Sig.(双侧) 5