双样本假设检验及区间估计 下载本文

第十章 双样本假设检验及区间估计

双样本统计,除了有大样本、小样本之分外,根据抽样之不同,还可分为独立样本与配对样本。所谓独立样本,指双样本是在两个总体中相互独立地抽取的。所谓配对样本,指只有一个总体,双样本是由于样本中的个体两两匹配成对而产生的。配对样本就不是相互独立的了。

第一节 两总体大样本假设检验

1. 大样本均值差检验

为了把单样本检验推广到能够比较两个样本的均值的检验,必须再一次运用中心极限定

22

理。下面是一条由中心极限定理推广而来的重要定理:如果从N(μ1,σ1)和N(μ2,σ2)两个总体中分别抽取容量为n1和n2的独立随机样本,那么两个样本的均值差(X1―X2)的抽

3?12?2样分布就是N(μ1―μ2,+)。与单样本的情况相同,在大样本的情况下(两个样本的

n1n2容量都超过50),这个定理可以推广应用于任何具有均值μ1和μ2 以及方差σ

21

和σ

22

的两

个总体。当n1和n2逐渐变大时,(X1―X2)的抽样分布像前面那样将接近正态分布。 大样本均值差检验的步骤有:

(1) 零 假 设H0:μ1―μ2=D0

备择假设H1:

单侧 双侧

H1:μ1―μ2>D0 H1:μ1―μ2≠D0 或 H1:μ1―μ2<D0

(2)否定域:单侧Zα,双侧Zα/2。 (3)检验统计量 Z=

(X1?X2)?D0(X1?X2)?D0?(X2

1?X2)?21n12

2

2

??22

n2如果σ1和σ2未知,可用S1和S2代替。 (4)判定

2. 大样本成数差检验

与单样本成数检验中的情况一样,两个成数的差可以被看作两个均值差的特例来处理(但它适用各种量度层次)。于是,大样本成数检验的步骤有:

(1) 零 假 设H0:p1―p2=D0

备择假设H1:

单侧 双侧 H1:p1―p2>D0 H1:p1―p2≠D0 或 H1:p1―p2<D0

(2)否定域:单侧Zα,双侧Zα/2。 (3)检验统计量

1

Z=

(p1?p2)?D0(p1?p2)?D0=

???p1q1p2q2(p1?p2)?n1n2??x1x其中:p1=为总体1的样本成数;p2=2为总体2的样本成数。

n1n2?????? 当p1和p2未知,须用样本成数p1和p2进行估算时,要分两种情况讨论。

第二节 两总体小样本假设检验

与对单总体小样本假设检验一样,本书对两总体小样本假设检只讨论总体满足正态分布的情况。

1. 小样本均值差检验

22

设两总体分别满足正态分布N(μ1,σ1)和N(μ2,σ2),与单总体小样本的情况相似,

22

对总体均值差,根据σ1和σ2是否已知,也须采用不同的统计量。 A.σ

21

和σ

22

已知

B.σ12和σ22未知,但假定它们相等。 C.σ12和σ22未知,但不能假定它们相等

2. 小样本方差比检验

检验方差比所用统计量为 F =

S1?2?2∽F(n1―1,n2―1)

S2 方差比检验,比起前面所介绍的检验有一个不同点,那就是无论是单侧检验还是双侧检验,F的临界值都只在右侧。其原因是我们总是把S2和S1中的较大者放在分子上,以便使用者掌握。因此有

F =

?2?2S1?2?2≥1或者F =

S2S1?2?2≥1

S2第三节 配对样本的假设检验

配对样本,是两个样本的单位两两匹配成对,它实际上只能算作一个样本,也称关联样本。

1. 单一实验组的假设检验

关于配对样本的假设检验,我们通过单一实验组的实验来加以理解。单一实验组实验是对同一对象在某种措施实行前后进行观察比较的一种简单实验,它只有实验组而没有控制组。或者说,同一个组在实施实验刺激之前是实验中的“控制组”,在实施实验刺激之后就成了“实验组”。

2

对于单一实验组这种“前—后”对比型配对样本的假设检验,我们的做法是,不用均值差检验,而是求出每一对观察数据的差,直接进行一对一的比较。如果采用“前测”“后测”两个总体无差异的零假设,也就是等于假定实验刺激无效。于是,问题就转化为每对观察数据差的均值μd =0的单样本假设检验了。

2.一实验组与一控制组的假设检验

单一实验组实验的逻辑,是把实验对象前测后测之间的变化全部归因于实验刺激。在社会现实生活进行的实际实验中,对象前测后测之间的变化,有时除了受到实验刺激外,还受到其他社会因素的作用。因而,配对样本的一实验组与一控制组之假设检验,要设法把实验变量的作用和额外变量的作用区分开来,然后就像对待单一实验组实验一样,把问题转化为零假设μd=0的单样本检验来处理。

3.对实验设计与相关检验的评论

第四节 双样本区间估计

双样本区间估计和双样本假设检验的联系是很紧密的。双样本区间估计,即是为均值差或成数差设置置信区间的方法,这需要我们汇合单样本区间估计和双样本假设检验两方面的知识。

22

1. σ1和σ2已知,对均数差的区间估计

[(X1―X2)―Zα/2

2. σ1和σ2未知,对均值差的区间估计

对于大样本,σ间即可。

21

2

2

?12n1?2?2n2,(X1―X2) + Zα

/2

?12n1?2?2n2]

和σ

22

未知,可以用S1和S2替代,然后用上式求出均值差的置信区

2

2

22

对于大样本,σ1和σ2未知,可以用S1和S2替代,然后用(10.17)式求出均值差的

22

置信区间即可。对于小样本,σ1和σ2未知,两样本均值差的抽样分布就不再服从Z分布,而是服从t分布了。此时

[(X1―X2)―tα/2(n1+ n2 ―2)?(X2

2

1?X2)22

,(X1―X2) + tα/2(n1+ n2 ―2)??(X1?X2)]

2S12S2?如果不能假设σ1=σ2,求算?(X1?X2)则要用 ?(X1?X2)= n1?1n2?1?

3.大样本成数差的区间估计

与单样本成数的区间估计一样,成数差区间估计可以被看作均值差的特例来处理(但它适用于各种量度层次)。

[(p1―p2)―Zα/2

????p1q1p2q2,(p1―p2)+ Zα/2?n1n2??p1q1p2q2] ?n1n2 如果总体成数p1和p2未知,可用样本成数p1和p2代替,同时分两种情况讨论:

3