第一节 方差分析的基本原理与步骤
方差分析有很多类型,无论简单与否,其基本原理与步骤是相同的。本节结合单因素试验结果的方差分析介绍其原理与步骤。
一、线性模型与基本假定
假设某单因素试验有k个处理,每个处理有n次重复,共有nk个观测值。这类试验资料的数据模式如表6-1所示。
表6-1k个处理每个处理有n个观测值的数据模式 处理
观测值
计
合
均
平
A1 A2 Ai Ak 合 计
x11 x21 xi1 xk1
x12 x22 xi2 xk2
? ? ? ? ? ?
x1j x2j xij xkj
? ? ? ? ? ?
x1n x2n xin xkn
xk.
表中表示第i个处理的第j个观测值(i=1,2,?,k;j=1,2,?,n);
表示第i个处理n个观测值的和;表示全部观测值的总和;
表示第i个处理的平均数;
测值的总平均数;
(6-1)
可以分解为
表示全部观
表示第i个处理观测值总体的平均数。为了看出各处理的影响大小,将行分解,令
再进
(6-2) (6-3)
则
(6-4)
其中μ表示全试验观测值总体的平均数,
是第i个处理的效应
(treatmenteffects)表示处理i对试验结果产生的影响。显然有
(6-5)
εij是试验误差,相互独立,且服从正态分布N(0,σ2)。
(6-4)式叫做单因素试验的线性模型(linearmodel)亦称数学模型。在这个模型中
表示为总平均数μ、处理效应αi、试验误差εij之和。由εij相互
独立且服从正态分布N(0,σ2),可知各处理Ai(i=1,2,?,k)所属总体亦应具正态性,即服从正态分布N(μi,σ2)。尽管各总体的均数
可以不等或相
等,σ2则必须是相等的。所以,单因素试验的数学模型可归纳为:效应的可加性(additivity)、分布的正态性(normality)、方差的同质性(homogeneity)。这也是进行其它类型方差分析的前提或基本假定。
若将表(6-1)中的观测值xij(i=1,2,?,k;j=1,2,?,n)的数据结构(模型)用样本符号来表示,则
(6-6)
与(6-4)式比较可知,、=
、(xij-)=
的估计值。
),
、
分别是μ、(μi-μ)
(6-4)、(6-6)两式告诉我们:每个观测值都包含处理效应(μi-μ或与误差(
或
),故kn个观测值的总变异可分解为处理间的变异和处理
内的变异两部分。
二、平方和与自由度的剖分
我们知道,方差与标准差都可以用来度量样本的变异程度。因为方差在统计分析上有许多优点,而且不用开方,所以在方差分析中是用样本方差即均方(meansquares)来度量资料的变异程度的。表6-1中全部观测值的总变异可以
用总均方来度量。将总变异分解为处理间变异和处理内变异,就是要将总均方分解为处理间均方和处理内均方。但这种分解是通过将总均方的分子──称为总离均差平方和,简称为总平方和,剖分成处理间平方和与处理内平方和两部分;将总均方的分母──称为总自由度,剖分成处理间自由度与处理内自由度两部分来实现的。
(一)总平方和的剖分在表6-1中,反映全部观测值总变异的总平方和是各观测值xij与总平均数
因为
的离均差平方和,记为SST。即
其中
所以(6-7)
(6-7)式中,为各处理平均数与总平均数的离均差平方和与
重复数n的乘积,反映了重复n次的处理间变异,称为处理间平方和,记为SSt,即
(6-7)式中,为各处理内离均差平方和之和,反映了各处理内的变
异即误差,称为处理内平方和或误差平方和,记为SSe,即
于是有
SST=SSt+SSe(6-8)