R语言学习系列26-均值的t检验 下载本文

24. 均值的T检验

(一)t分布

2),若样本均数X服从正态分布N(?,?X经过U变换

X???X, 可以

变成标准正态分布N(0, 12), 也成为U分布.

实际工作中,由于总体标准差?X未知,用样本标准差SX代替,则

X??不再服从标准正态分布,而是服从t分布: SXt?X??X???, ??n?1 SXS/n其中,S为样本方差,n为样本含量,v为自由度。

t分布只有一个参数——自由度v. v→∞时,t分布无限接近标准正态分布。

t分布的图形

说明:

单侧概率(单侧尾部面积)用t?,?表示; 双侧概率(双侧尾部面积)用t?/2,?表示;

例如,t0.05,10=1.812, 则P(t≤-1.812)=P(t≥1.812)=0.05 t0.05/2,10=2.228, 则P(t≤-2.228)+P(t≥2.228)=0.05

(二)t检验

t检验,是一种针对连续变量的参数假设检验,用来检验“单样本均值与已知均值(单样本t检验)、两独立样本均值(独立样本t检验)、配对设计资料的均值(配对样本t检验)”是否存在差异,这种差异是否能推论至总体。

T检验适用于样本含量较小(比如n<60,大样本数据可以用U检验),适用条件:

①数据服从正态分布;

②满足方差齐性(方差相等);

注:若数据不满足①,②,可以尝试对数据做变量变换:对数变换、平方根变换、倒数变换、平方根反正弦变换等。

方差齐性检验

要求两样本数据的总体均服从正态分布,统计量F为为较大的方差与较小的方差的比值:

S12F?2, ?1?n1?1, ?2?n2?1

S2原假设H0:两总体方差相等; H1:两总体方差不相等。

使用car包中的函数leveneTest()实现,基本格式为:

leveneTest(y, group, center=, ...) leveneTest(formula,data,subset,...)

其中,y为样本数据;

group为因子型的分组变量;

center指定计算每组的中心的方法,默认是中位数median,也可以用均值mean

formula设置公式格式:formula=定量变量~分组变量 示例:

setwd(\办公资料/R语言/R语言学习系列/codes\load(\ head(chengji,3)

class sex Math English Rank 1 1 1 60 66 4 2 1 1 42 58 5 3 1 1 78 95 3 library(car)

leveneTest(Math~as.factor(class),data=chengji)