第三节 方差分析
在一个因素不同水平下(三个水平以上)或是在多个因素不同水平组合下测量一个连续反应变量(因变量),这个反应变量的总变异可被解释为分类变量的效应(即主效应,如A,B分别表示由于分类变量A和B的不同水平引起的变异)或分类变量的组合产生的效应(即交互效应,如A*B表示A与B的交互作用),余下的变异为随机误差。
方差分析的基本思想是将所有观察值的总变异分解成不同的变异来源,即对总变异的自由度和平方和进行分解,进而获得不同变异来源的总体方差的估值。通过构建适当的F值,进行F测验,完成多个样本平均数之间差异显著性测验。当处理效应为固定效应时,尚可对各个处理平均数进行多重比较。 变异 来源 A B A *B
SSA=QA-C
离均差平方和(SS) 自由度
(df) p-1
均方 (MS)
MSA/MSE MSB/MSE
* *
F值
P值
SSA/dfA
SSB/dfB
SSB=QB-C q-1
p-1)SSAxB/ SSAXB=QAB-C- SSA – (
dfAxB
SSB (q-1) SSE=SST-SSA-SSB- SSAB
Pq(r-1) SSe/dfe
(MSE)
MSAB/MSE *
误差
总计
SST=W-C pqr-1
一 、 方差分析(ANOVA)过程 ? 过程格式: Proc anova;
Class分类变量名列表;
Model依变量=自变量效应表/选项; Means自变量效应名列表/选项; Test H=效应变量名 E=误差项; Run; Proc anova;
Class 分类变量名列表; 通常对主效应变量进行分类,如果是区组试验,需要
同时对区组变量进行分类; Model依变量=自变量效列出希望计算出的效应变量,一般为主效应、互作效应表/选项; 应、区组效应;给出主效应和互作效应的方差分析结
果。
Y= a 单因素主效模型 Y= a b a*b两因素带互作模型
Y= a b c a*b a*c b*c a*b*c 三因素带互作模型;
Means自变量效应名列进行多重比较分析,主要分析同一因素不同水平表/选项; 间的效应差异;一般只对主效应分析;
选项用于设定多重比较方法等,常用的选项有
LSD或t(最小显著差数法)DUNCAN(新复极差测验)TUKEY(固定极差测验法)。
显著水平的设定ALPHA=α,缺省值为0.05。
Test H=效应变量名 E=TEST H=效应表 E=效应:用以指定某效应作
误差项; 为误差项。缺省时,以残差MSE作为误差项。其中:
H=效应变量名,用以指定MODEL语句中作为
假设检验的效应,
E=误差项,用以指定作为误差项的效应,常用主
效应*区组效应。
RUN;
二、方差分析的类型 1、试验设计类型:
? 随机试验设计 ? 随机区组试验设计 1)单因素试验
① 单项分组资料的方差分析(单因素完全随机试验)
变异处理组间
误差 SSE=SST-SSA N-P 总计 SST=W-C
N-1
离均差平方SSA=QA-C
自由度 (df) p-1
均方 (MS) SS组间/df组间 SS组内/df组内
MS组间/MS组内
F值
P值
来源 和(SS)
Proc anova; Class A; Model Y= A ; NEANS A/LSD; Run;
② 单因素完全随机区组试验 变异来源 处理组间 区组间 误差 总计
离均差平方和(SS) 自由度
(df)
SSA=QA-C SSB=QB-C SSE=SST-SSA-SSB SST=W-C
a-1 b-1 N-1
均方 (MS) SSA/dfA SSB/dfB
MSA/MSE MSB/MSE
F值
P值
N-a-b+1 SSE/dfE
Proc anova; Class A C; Model Y= A C;