葡萄酒的评价模型
摘要:本文主要针对葡萄酒的评价问题建立了相关数学模型。在对两组评酒员的评价是否存在显著性差异的问题中,首先验证了两组评酒员的评价结果服从正态分布,并通过方差分析法对两组评酒员的评价结果进行了分析,发现两组评酒员对于红葡萄酒和白葡萄酒的评价结果均存在显著性差异,由于第二组评酒员的评分方差更小,故评价结果均衡度更好,其结果可信度更大。
在对酿酒葡萄进行分级的问题中,首先以相关系数衡量葡萄理化指标与葡萄酒质量的相似性程度,然后筛选出与葡萄酒质量相关性较大的理化指标与葡萄酒质量一起作为评估葡萄质量的评价指标,利用筛选出的评价指标对酿酒葡萄进行聚类分析,将红葡萄和白葡萄均分成了四类。最后以每类中对应葡萄酒质量评分的均值作为该类葡萄的分数,从而定出四类的级别,以对应国家葡萄酒的四级分类标准。
在分析酿酒葡萄与葡萄酒的理化指标间的联系问题中,本文采用偏最小二乘回归分析法对指标间的联系进行了分析计算,发现葡萄酒中的某些理化指标与葡萄的某些理化指标存在较强的相关性,比如白葡萄中的总糖和还原糖对白葡萄酒中顺式白藜芦醇苷和顺式白藜芦醇以及反式白藜芦醇的影响较大。
在判断葡萄与葡萄酒的理化指标与葡萄酒的质量间关系的问题中,首先对葡萄和葡萄酒的理化指标与葡萄酒的质量进行了相关性分析,发现某些理化指标与葡萄酒的质量相关性很大。然后筛选出这些相关性较大的指标,用偏最小二乘回归分析法进一步定量分析了这些指标与葡萄酒质量的关系,建立了葡萄酒质量的评价模型,经过检验,利用建立的评价模型对葡萄酒评价结果与专家组的评价结果误差普遍小于5%,这同时论证了用葡萄和葡萄酒的理化指标对葡萄酒进行评价是基本可行的。 关键字:显著性检验;聚类分析 ;偏最小二乘回归分析法
word文档 可自由复制编辑
1 问题的重述
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。建立数学模型讨论下列问题:
(1)分析两组评酒员的评价结果有无显著性差异,哪一组结果更可信? (2)根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 (3)分析酿酒葡萄与葡萄酒的理化指标之间的联系。
(4)分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
2 问题的分析
对于问题(1),两组评酒员分别对27种红葡萄酒和28种白葡萄酒进行了评价,通常情况下,评价结果一般服从正态分布,所以首先应当对评价数据进行?2拟合检验法[1],然后利用方差分析对两组评酒员的评价结果进行显著性分析。一个较好的评价组应是本着客观的原则进行评价,因此评价结果通常较为均匀,据此,可以分别计算出各组评酒员评价结果的方差,方差越大表明组内成员的评价差异越大,可信度就越低。
对于问题(2),题目要求根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,首先就必须从这些指标中找到与酿酒葡萄分级有关的指标。考虑到酿酒葡萄的用途是酿制葡萄酒,因此葡萄酒的质量可以作为衡量酿酒葡萄质量的重要指标。而那些与葡萄酒质量相似性程度较大的酿酒葡萄理化指标也应作为酿酒葡萄的评估价指标。采用计算相关系数的方法计算两者间相似性程度,选定合适的相关系数为界线即得出酿酒葡萄质量评价指标。在酿酒葡萄质量指标确认后,采取聚类分析的方法对酿酒葡萄进行分类。分类后,各类中葡萄酿制葡萄酒的质量得分即作为各类分数,从而分出酿酒葡萄的级别。
对于问题(3),要求对葡萄与葡萄酒的理化指标的联系进行分析,葡萄的二级理化指标有50多种,葡萄酒的理化指标有15种左右,并且各个指标间可能存在较大的关联度,研究两组多重相关变量间的关系问题,可以考虑用偏最小二乘回归分析法。
对于问题(4),首先利用问题(2)中相关性分析法和聚类分析法,筛选出与葡萄酒质量关联度较大的一些关键指标。经过去除掉对葡萄酒质量影响较小的指标,不仅可以简化计算,而且在实际研究中,工作人员只需测量这些关键指标即可,减少了工作量。然后利用偏最小二乘回归分析法,分析筛选后的指标与葡萄酒质量的函数关系,进而得到对葡萄酒质量的评价模型。为检验所建评价模型的准确性,可以考虑将样本数据分成两部分,一部分数据用于分析计算评价模型,然后利用另一部分数据对模型进行检验。如果说误差较小,则说明所建评价模型较为满意,同时也论证了用理化指标对葡萄酒的质量进行评价的可行性。
3 模型的假设
(1) 酿酒葡萄的酿造水平与酿造环境相同; (2) 酿制同一种酒使用的葡萄是相同的;
word文档 可自由复制编辑
4 符号说明
k:第一组评酒员中第i个评酒员对第j种红葡萄酒的第k个理化指标的评分; aijaij:第一组评酒员中第i个评酒员对第j种红葡萄酒的总评分; V1j:第一组评酒员对第j种红葡萄酒评价结果的方差; rij:第i个指标与第j个指标间的相关系数。
5 模型的建立与求解
5.1 两组评酒员评价结果的差异分析 5.1.1 数据的处理与准备
根据题意,共有两组评酒员,每组有十个成员,每个评酒员在评价任意一种酒时,均考虑了四项一级指标和十项二级指标,每种酒的评价满分为100分,其中各个指标所占分值如表1所示。为方便计,将各个二级指标按照表1中从左至右的顺序依次编为1—10号。
一级指标 外观分析 二级指标 澄清度 色调 分 值 5 10 表1 各指标所占分值 香气分析 纯正度 浓度 质量 纯正度 6 8 16 6 口感分析 浓度 持久性 质量 8 8 22 整体 整体 11 k记aij,aij分别表示第一组评酒员中第i个评酒员,对第j种红葡萄酒第k个二级指k标的评分和对第j种红葡萄酒的总评分, bij,bij分别表示第二组评酒员中第i个评酒员,
对第j种红葡萄酒第k个二级指标的评分和对第j种红葡萄酒的总评分,i?1,2,?,10,j?1,2,?,27,k?1,2,?,10,则有
10?kaij?∑aij,??k?1 ?10?b?bk.ijij∑?k?1?假设把每一组所有评酒员对第j种红葡萄酒的平均评分,作为该组对该种红葡萄酒的最终评分,分别用Aj,Bj表示第一组和第二组对第j种红葡萄酒的最终评分,
j?1,2,?,27则
?110Aj??aij,?10i?1? ?10?B?1b,j?1,2,?,27.jij?10∑i?1?
同样,记fijk,fij分别表示第一组评酒员中第i个评酒员,对第j种白葡萄酒第k个
k二级项指标的评分和第j种白葡萄酒的总评分,gij,gij分别表示第二组评酒员中第i个
评酒员,对第j种白葡萄酒第k个二级指标的评分和第j种白葡萄酒的总评分,i,k?1,2,?,10,j?1,2,?,28。则
word文档 可自由复制编辑