现代心理与教育统计学复习资料 下载本文

3、二项分布的平均数和标准差

? 如果二项分布满足p>q且 nq≥5(或者p<q且 np≥5时,二项分布接近于正态

分布。可用下面的方法计算二项分布的平均数和标准差。 ? 二项分布的平均数为: ? 二项分布的标准差为: 四、概率分布——样本分布

(一)、抽样分布 区分三种不同性质的分布:

? 总体分布:总体内个体数值的频数分布 ? 样本分布:样本内个体数值的频数分布 ? 抽样分布:某一种统计量的概率分布

1. 抽样分布的概念 抽样分布是从同一总体内抽取的不同样本的统计量的概率分布。 抽样分布是一个理论的概率分布,是统计推断的依据。 2.平均数抽样分布的几个定理

⑴.从总体中随机抽出容量为n的一切可能样本的平均数之平均数等于总体的平均数。

??np??npqE(X)??⑵.容量为n的平均数在抽样分布上的标准差(即平均数的标准误),等于总体标准差除以n的平方根。

?X??n⑶.从正态总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布。 ⑷.虽然总体不呈正态分布,如果样本容量较大,反映总体μ和σ的样本平均数的抽样分布,也接近于正态分布。 (二)标准误

某种统计量在抽样分布上的标准差,称为标准误。标准误用来衡量抽样误差。标准误越小,

表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。因此,标准误是统计推断可靠性的指标。 平均数标准误的计算

1.总体正态,σ已知(不管样本容量大小),或总体非正态,σ已知,大样本

平均数的标准误为:

??X?n?X?2.总体正态,σ未知(不管样本容量大小),或总体非正态,σ未知,大样本

平均数标准误的估计值为: (三)平均数离差统计量的分布

1.总体正态,σ已知(不管样本容量大小),或总体非正态,σ已知,大样本

平均数离差的的抽样分布呈正态分布 正态总体,样本平均数的抽样分布

Sn?1Z?X???X?X???n???X?2?X?2n2.总体正态,σ未知(不管样本容量大小),或总体非正态,σ未知,大样本

平均数离差的的抽样分布呈t分布 t分布的特点

⑴.形状与正态分布曲线相似

⑵.t分布曲线随自由度不同而有一簇曲线

⑶.自由度的计算:自由度是指能够独立变化的数据个数。

⑷.查t分布表时,需根据自由度及相应的显著性水平,并要注意是单侧数据还是双侧。 3.总体σ未知,大样本时的近似处理

样本容量增大后,平均数的抽样分布接近于正态分布,可用正态分布近似处理:

t?X???XX???Sn?1Z??X???X?X??Sn第七章

一、点估计、区间估计与标准误 (一)总体参数估计的基本原理

根据样本统计量对相应总体参数所作的估计叫做总体参数估计。 总体参数估计分为点估计和区间估计。

由样本的标准差估计总体的标准差即为点估计;而由样本的平均数估计总体平均数的取值范围则为区间估计。 (二)点估计

1、良好的点估计量应具备的条件

无偏性: 如果一切可能个样本统计量的值与总体参数值偏差的平均值为0,这种统计量就是总体参数的无偏估计量。

有效性: 当总体参数不止有一种无偏估计量时,某一种估计量的一切可能样本值的方差小者为有效性高,方差大者为有效性低。

一致性: 当样本容量无限增大时,估计量的值能越来越接近它所估计的总体参数值,这种估计是总体参数一致性估计量。

充分性 :一个容量为n的样本统计量,应能充分地反映全部n个数据所反映的总体的信息。 2、点估计量的缺点:有偏差,没有提供正确估计的概率,即不能提供估计值与参数真值的接近程度和可靠程度 (三)区间估计

区间估计得出的不是一个单一数值,而是一个数值区间。它既可以告诉我们参数的真值在什么范围内,又能告诉我们参数的真值落在这个范围的概率有多大。

区间估计的基础——抽样分布

根据抽样分布的特点及原理,不同总体条件下,可能会有不同的抽样分布,则可得到不同条件下总体参数的区间估计的计算方法。 区间估计涉及和置信区间和显著性水平。

区间估计

以样本统计量的抽样分布(概率分布)为理论依据,按一定概率的要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。

对总体参数值进行区间估计,就是要在一定可靠度上求出总体参数的置信区间的上下限。 ⑴要知道与所要估计的参数相对应的样本统计量的值,以及样本统计量的理论分布; ⑵要求出该种统计量的标准误;

⑶要确定在多大的可靠度上对总体参数作估计,再通过某种理论概率分布表,找出与某种可靠度相对应的该分布横轴上记分的临界值,才能计算出总体参数的置信区间的上下限。

置信区间

置信度,即置信概率,是作出某种推断时正确的可能性(概率)。

置信区间,也称置信间距(confidence interval,CI)是指在某一置信度时,总体参数所在的区域距离或区域长度。置信区间是带有置信概率的取值区间。

显著性水平

对总体平均数进行区间估计时,置信概率表示做出正确推断的可能性,但这种估计还是会有犯错误的可能。显著性水平(significance level)就是指估计总体参数落在某一区间时,可能犯错误的概率,用符号α表示。 P=1-α

2、平均数区间估计的基本原理

通过样本的平均数估计总体的平均数,首先假定该样本是随机取自一个正态分布的母总体(或非正态总体中的n>30的样本),而计算出来的实际平均数是无数容量为n的样本平均数中的一个。

根据样本平均数的分布理论,可以对总体平均数进行估计,并以概率说明其正确的可能性。 三、总体平均数的估计 (一)总体平均数的区间估计

1.总体平均数区间估计的基本步骤 ①.根据样本的数据,计算样本的平均数和标准差; ②.计算平均数抽样分布的标准误; ③.确定置信概率或显著性水平; ④.根据样本平均数的抽样分布确定查何种统计表; ⑤.计算置信区间; ⑥.解释总体平均数的置信区间。 2.平均数区间估计的计算

①总体正态,σ已知(不管样本容量大小),或总体非正态,σ已知,大样本

样本平均数的分布呈正态,平均数的置信区间为: X?Z??2?n???X?Z??2?n②总体正态,σ未知(不管样本容量大小),或总体非正态,σ未知,大样本 样本平均数的分布为t分布,平均数的置信区间为:X ③总体正态,σ未知,大样本

平均数的抽样分布接近于正态分布,用正态分布代替t分布近似处理: ④ 总体非正态,小样本

?t?df???2SS???X?t?df???n?1n?12SSX?Z?????X?Z??nn22不能进行参数估计,即不能根据样本分布对总体平均数进行估计。