SPSS在生物统计学中的应用
——实验指导手册
实验五:方差分析
一、实验目标与要求
1.帮助学生深入了解方差及方差分析的基本概念,掌握方差分析的基本思想和原理 2.掌握方差分析的过程。
3.增强学生的实践能力,使学生能够利用SPSS统计软件,熟练进行单因素方差分析、两因素方差分析等操作,激发学生的学习兴趣,增强自我学习和研究的能力。
二、实验原理
在现实的生产和经营管理过程中,影响产品质量、数量或销量的因素往往很多。例如,农作物的产量受作物的品种、施肥的多少及种类等的影响;某种商品的销量受商品价格、质量、广告等的影响。为此引入方差分析的方法。
方差分析也是一种假设检验,它是对全部样本观测值的变动进行分解,将某种控制因素下各组样本观测值之间可能存在的由该因素导致的系统性误差与随即误差加以比较,据以推断各组样本之间是否存在显著差异。若存在显著差异,则说明该因素对各总体的影响是显著的。
方差分析有3个基本的概念:观测变量、因素和水平。
? 观测变量是进行方差分析所研究的对象; ? 因素是影响观测变量变化的客观或人为条件;
? 因素的不同类别或不通取值则称为因素的不同水平。在上面的例子中,农作物的产量和商品的销
量就是观测变量,作物的品种、施肥种类、商品价格、广告等就是因素。在方差分析中,因素常常是某一个或多个离散型的分类变量。 ? 根据观测变量的个数,可将方差分析分为单变量方差分析和多变量方差分析; ? 根据因素个数,可分为单因素方差分析和多因素方差分析。
在SPSS中,有One-way ANOVA(单变量-单因素方差分析)、GLM Univariate(单变量多因素方差分析);GLM Multivariate (多变量多因素方差分析),不同的方差分析方法适用于不同的实际情况。本节仅练习最为常用的单变量方差分析。
三、实验演示内容与步骤 ㈠ 单变量-单因素方差分析
单因素方差分析也称一维方差分析,对两组以上的均值加以比较。检验由单一因素影响的一个分析变量由因素各水平分组的均值之间的差异是否有统计意义。并可以进行两两组间均值的比较,称作组间均值的多重比较。主要采用One-way ANOVA过程。
采用One-way ANOVA过程要求:因变量属于正态分布总体,若因变量的分布明显是非正态,应该用非参数分析过程。若对被观测对象的实验不是随机分组的,而是进行的重复测量形成几个彼此不独立的变量,应该用Repeated Measure菜单项,进行重复测量方差分析,条件满足时,还可以进行趋势分析。
【例6.1】欲比较四种饲料对仔猪增重效果的优劣,随机选取了性别、年龄、体重相同,无亲缘关系的20头猪,随机分为4组,每组5头,分别饲喂一种饲料所得增重数据如下在。试利用这些数据对4种饲料对仔猪
增重效果的差异进行检验。
饲料 A B C D 合计
57 13 13 18
37 39 15 24
日增重(g)
54 41 13 38 600
42 33 29 22
60 19 20 13
均值xi 50 29 18 23 μ=
打开数据文件“单因素方差分析数据-1.xls”。在SPSS中实验该检验的步骤如下: ? 步骤1:选择菜单【分析】→【比较均值】→【单因素方差分析】,依次将观测变量销量移入因变量列表框,将因素变量地区移入因子列表框。
x =30
图 5.1 One-Way ANOVA 对话框
? 单击两两比较按钮,如图5.2,该对话框用于进行多重比较检验,即各因素水平下观测变量均值的两两比较。
方差分析的原假设是各个因素水平下的观测变量均值都相等,备择假设是各均值不完全相等。假如一次方差分析的结果是拒绝原假设,我们只能判断各观测变量均值不完全相等,却不能得出各均值完全不相等的结论。各因素水平下观测变量均值的更为细致的比较就需要用多重比较检验。
图 5.2 两两比较对话框
假定方差齐性选项栏中给出了在观测变量满足不同因素水平下的方差齐性条件下的多种检验方法。
? LSD。使用 t 检验执行组均值之间的所有成对比较。对多个比较的误差率不做调整。 ? Bonferroni。使用 t 检验在组均值之间执行成对比较,但通过将每次检验的错误率设置为实验性质的
错误率除以检验总数来控制总体误差率。这样,根据进行多个比较的实情对观察的显著性水平进行调整。 ? Sidak。基于 t 统计量的成对多重比较检验。Sidak 调整多重比较的显著性水平,并提供比 Bonferroni
更严密的边界。
? Scheffe。为均值的所有可能的成对组合执行并发的联合成对比较。使用 F 取样分布。可用来检查组
均值的所有可能的线性组合,而非仅限于成对组合。
? R-E-G-W F。基于 F 检验的 Ryan-Einot-Gabriel-Welsch 多步进过程。 ? R-E-G-W Q。基于学生化范围的 Ryan-Einot-Gabriel-Welsch 多步进过程。 ? S-N-K.使用学生化的范围分布在均值之间进行所有成对比较。它还使用步进式过程比较具有相同样
本大小的同类子集内的均值对。均值按从高到低排序,首先检验极端差分。
? Tukey。使用学生化的范围统计量进行组间所有成对比较。将试验误差率设置为所有成对比较的集合
的误差率。
? Tukey's b。使用学生化的范围分布在组之间进行成对比较。临界值是 Tukey's 真实显著性差异检验
的对应值与 Student-Newman-Keuls 的平均数。
? Duncan。使用与 Student-Newman-Keuls 检验所使用的完全一样的逐步顺序成对比较,但要为检验
的集合的错误率设置保护水平,而不是为单个检验的错误率设置保护水平。使用学生化的范围统计量。
? Hochberg's GT2。使用学生化最大模数的多重比较和范围检验。与 Tukey's 真实显著性差异检验相似。 ? Gabriel。使用学生化最大模数的成对比较检验,并且当单元格大小不相等时,它通常比 Hochberg's
GT2 更为强大。当单元大小变化过大时,Gabriel 检验可能会变得随意。 ? Waller-Duncan。基于 t 统计的多比较检验;使用 Bayesian 方法。
? Dunnett。将一组处理与单个控制均值进行比较的成对多重比较 t 检验。 最后一类是缺省的控制类
别。另外,您还可以选择第一个类别。双面检验任何水平(除了控制类别外)的因子的均值是否不