龙源期刊网 http://www.qikan.com.cn
通过统计分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量进行科学评价
作者:王艺淳 吕宏伟 武采怡
来源:《中国科技博览》2013年第32期
摘要:本论文目的在于解决2012 年中国大学生数学建模比赛A题中的二题。分析过程是以红葡萄为样本,白葡萄的相关结论类似方法可得。论文的数据处理借助SPSS 统计软件。我们采用聚类分析的统计方法,使用K-Means Cluster 分类法将葡萄酒成为3 组,采用Wilks’ Lambda方法对分类的葡萄进行判别,判别标准采用F值判别法。
关键字:葡萄酒质量与等级 理化性质 相关分析 聚类分析与判别分析 回归分析 中图分类号:F426.31 文献标识码:A 文章编号:1009-914X(2013)32-005-01 一、问题重述
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。建立数学模型讨论:
根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 二、模型建立与求解
我们了解到葡萄的某些理化指标反应了葡萄酒的质量,其质量与附件一的列表中葡萄酒评分员评分情况有一定关联。使用Excel表格计算出每项酿酒葡萄理化指标的平均值,用SPSS软件计算出酿酒葡萄的理化指标与其质量的相关性,以决定对葡萄酒质量影响最大的理化指标。取定理化指标后,用SPSS软件将葡萄酒按照理化指标进行聚类分析以得到葡萄酒的分级情况,再对葡萄酒的分级依据(包括Fisher判别函数,典则判别函数散点图)进行说明。 2.1 根据相关性矩阵(如图1)找出和葡萄酒质量最相关的三个红葡萄理化指标,它们分别是DPPH自由值、总酚和葡萄糖总黄酮。
澄清度 色调 纯正度 浓度 质量 纯正度 浓度 持久性 质量 平衡/整体评价
DPPH自由基 Pearson 相关性 -.104 .622** .585** .509** .564** .453* .394* .300 .165 .407* 显著性(双侧) .606 .001 .001 .007 .002 .018 .042 .129 .411 .035
龙源期刊网 http://www.qikan.com.cn
N 27 27 27 27 27 27 27 27 27 27
总酚 Pearson 相关性 -.389* .589** .390* .529** .496** .535** .640** .406* .386* .448* 显著性(双侧) .045 .001 .045 .005 .009 .004 .000 .036 .047 .019 N 27 27 27 27 27 27 27 27 27 27
葡萄总黄酮 Pearson 相关性 -.196 .544** .459* .577** .652** .594** .642** .356 .376 .504** 显著性(双侧) .328 .003 .016 .002 .000 .001 .000 .068 .054 .007 N 27 27 27 27 27 27 27 27 27 27 图 1
2.2 根据过程1中分析出的与葡萄酒质量最相关的葡萄理化指标,将红葡萄和白葡萄使用K-Means Cluster分类成为3组,供以后的判别分析使用,最终分类如图2(红葡萄) 样品编号 分类 样品编号 分类 样品编号 分类