葡萄酒评价
摘要
目前葡萄酒质量的确定通常是聘请一批有资质的评酒员对葡萄酒进行评分。本文主要探讨了如何评价葡萄酒的问题。
针对问题一,我们建立了方差检验模型。构造了变量F,通过假设检验确定两组评价结果有无显著性差异。考虑到每组均有10位评酒员对葡萄酒样品1-27进行打分,首先通过求解每组样品的加权评分方差,再对全部葡萄酒样品方差求平均值,最后利用平均方差对两组评价结果进行F检验。通过软件EXCEL进行计算,得出白葡萄F检验值为1.22,F白?F0.05?1.95,又红葡萄酒F检验值为1.71,
F红?F0.05?1.95,两组评酒员的评价结果无显著性差异。对两组平均方差值的大小进行比较,均值小的一组即为更可信的一组评价结果。通过计算得到的平均方差值和F检验值如下表所示: 第一组 第二组 红葡萄 0.87 0.51 白葡萄 1.036 0.85 可见,第二组的可信度高。
针对问题二,我们建立了综合评价模型。由于酿酒葡萄理化指标较多,我们利用数学软件SPSS13.0对酿酒葡萄进行了主成分分析,得到决定酿酒葡萄分级的主要指标。并通过变异系数法确定各主要指标的权重,计算出了酿酒葡萄的理化指标得分。根据附件一中的葡萄酒评分表,计算出了葡萄酒得分。将酿酒葡萄的理化指标得分与葡萄酒得分加权综合计算出一个总分,通过观察散点图,我们将葡萄分为优、良、差三个等级。
针对问题三,我们建立了回归模型。通过逐步回归确定了葡萄酒理化指标与哪些酿酒葡萄理化指标相关。并利用SPSS13.0对葡萄酒理化指标和酿酒葡萄理化指标进行相关性分析,建立了多元线性回归模型。既减少了运算量,又提高了计算精度。通过数学软件MATLAB2010编程计算,所求关系可以用葡萄酒的理化指标与酿酒葡萄的理化指标的线性表示。
针对问题四,我们建立了回归模型。首先用问题二的方法计算出葡萄酒的理化指标得分。然后以酿酒葡萄得分和葡萄酒的理化指标得分为自变量,葡萄酒质量得分为因变量,做回归分析。
在本文最后,对以上若干问题给出了模型的评价与推广,并对各个问题建立的模型优缺点进行了评价。
关键词:方差检验 主成分分析 回归分析 相关性分析 变异系数法
1
1 问题重述
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:
1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
2 问题分析
葡萄酒的品质主要取决于酿酒葡萄,酿制葡萄酒的原料葡萄对葡萄酒品质具有非常重要的影响。而葡萄的品质又主要取决于葡萄产地的气候和土壤等自然资源条件。不同的区域适合栽种不同种类和档次的葡萄,而不同种类的葡萄分别适用于不同品种的葡萄酒的酿造,即使同一区域同一品种的葡萄在不同年份也有品质的区分。故而葡萄酒的好坏往往难以准确评定。目前确定葡萄酒的质量通常采用的方法是聘请一批有资质的评酒员对葡萄酒进行评分。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
本题是关于如何评价葡萄酒的问题,可归结于综合评价一类。大量的数据处理多用到多元统计分析的方法。 对于问题一,分析两组评酒员的评价结果是否具有显著差异性,并判断出更可信的一组评价结果。考虑到判断的数据分为两组,我们利用方差分析对两组数据进行显著性检验,方差分析应用F检验法。通过比较计算出的F值与某一置信水平下F值大小比较,判断两组评价结果的是否具有显著性差异。为了确定更可信的一组评价结果,我们对两组方差平均值进行比较,方差平均值小,说明各评酒员评分结果差异小,总的打分过程比较稳定,波动性不是很大,我们有理由取平均方差小的一组作为更可信的评价结果。
对于问题二,考虑到酿酒葡萄理化指标较多,我们利用数学软件SPSS13.0对酿酒葡萄进行主成分分析,对决定酿酒葡萄分级的主要指标进行简化。并通过变异系数法确定各主要指标的权重,计算出酿酒葡萄的理化指标得分。根据附件一中的葡萄酒评分表,计算出了葡萄酒得分。将酿酒葡萄的理化指标得分与葡萄酒得分加权求和得到一个总分,并画出总分分布的散点图,通过观察散点图,对葡萄进行分级。
对于问题三,分析酿酒葡萄与葡萄酒的理化指标之间的联系。对于酿酒葡萄与葡萄酒的理化指标的联系问题,我们将其转化为酿酒葡萄的理化指标与葡萄酒
2
的理化指标间的关系。首先我们利用逐步回归的方法确定葡萄酒指标与哪些酿酒葡萄的理化指标相关。再利用SPSS进行相关性分析,并建立多元线性回归模型。
对于问题四,为确定酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,我们建立了二元回归分模型。
3 符号约定
apqi——第一组中的第p位评酒员对i种葡萄酒的第p项评分,i?1,2,?,27,
p,q?1,2,?,10;
bpqi——第二组中的第p位评酒员对i种葡萄酒的评分;
S12——为第一组加权评分的平均方差;
2——为第二组加权评分的平均方差; S2C——为葡萄酒的评分比例矩阵;
x1i——第一组第种葡萄酒的加权平均得分;
ix2i——第二组第种葡萄酒的加权平均得分;
iepi——第一组第p位评酒员的评分加权求和得分; fpi——第二组第p位评酒员的评分加权求和得分;
Vi ——第i个指标的变异系数即标准差系数;
?i——是第i项指标的标准差;
xi——第i项指标的平均数。
4 模型假设
1.假设两组评酒员是随机分配的;
2.假设评酒员对每种葡萄酒的评价结果是大致符合正态分布的; 3.假设所有样品酒的制作工艺是一样的; 4.假设所有葡萄酒酿造的环境相同;
5.假设不考虑多种葡萄可制成一种酒,只考虑一种葡萄制成一种酒; 6.假设本文所引用的数据、资料均真实可靠;
7.假设葡萄酒包含的理化指标没有人为加工,其理化指标均来自葡萄样品本身。
3
5 问题一的解答
5.1 问题一模型的建立——方差检验模型
附件一给出的两组评价,分别由两组评酒员对样品酒1-27从外观、香气、口感和整体四方面遵照一定的比例进行打分。考虑到问题一要求分析的是第一组和第二组总的评分结果是否存在显著差异性,并找出评分数据可信的一组。我们采用F检验法对数据进行显著性检验,并记算出每组平均方差值,平均方差值较小,说明该组10位评酒员对27种样品酒的评价结果一致性程度高,评分波动性不大,总的评价比较稳定,可信度也更高。
5.1.1 F检验法
F检验法是英国统计学家Fisher提出的,主要通过比较两组数据的方差S2,以确定他们的精密度是否有显著性差异。
这里我们主要对两组评价数据进行方差分析,应用F检验法,做显著性检验。 题中,我们假设每一个评酒员的评分都是随机的且服从正态分布。由题目可知,两组数据样本容量相同。
由于评酒员均从四个方面对同种葡萄酒进行打分,而四个方面的侧重程度存在差异。我们按照评分比例对每位评酒员的评分加权并求和,设葡萄酒的评分比例矩阵C,则
?5??10????6????8??16?C????6??8????8??22?????11??
又第一组第p位评酒员对第i种葡萄酒的打分矩阵A可写成
A?ap1i?ap2i?apqi?
设第二组第p位评酒员对第i种葡萄酒的打分矩阵B,则
B?bp1i?bp2i?bpqi
?故第p位评酒员的评分加权求和得分epi,可表示为
epi=AC
4
同理,第二组第p位评酒员的评分加权求和得分fpi:
fpi=AC
所以,第一组第i种葡萄酒的加权平均得分x1i是
?ex1i?p?110pi10
同理,第二组第i种红葡萄酒的加权平均得分x2i:
?fx2i?p?110pi10
第一组加权评分的平均方差S12:
S12?2同理可求得S2:
??(ei?1p?12710pi?x1i)210
2S2???(fi?1p?12710pi?x2i)210
最终F值为:
S12F?2
S22式中:S12为第一组加权评分的平均方差,S2为第二组加权评分的平均方差。
5.2 问题一模型的求解
根据以上模型,利用EXCEL计算得出每组每位评酒员对同一种葡萄酒的加权评分的平均值,求其方差,如下表一,表二。再对整组的方差求平均,即平均方差值。得到各组的平均方差,如下表三。利用EXCEL,即可求得F。
5