第九章抽样推断
通过本章学习掌握抽样推断的基本概念、抽样推断的基本原理和方法 【教学重点、难点】
重点:抽样推断的基本概念、随机抽样方法与抽样分布、抽样误差、参数估计和抽样的组织形式等,
难点:抽样推断的基本原理和方法。 【教学用具】多媒体 【教学过程】
学习重点:
第一节 抽样推断概述
一、抽样推断的一般概念
抽样推断是在根据随机原则从总体中抽取部分实际数据的基础上,运用数理统计方法,对总体某一现象的数量性作出具有一定可靠程度的估计判断。
抽样推断的特点:它是由部分推算整体的一种认识方法;它是建立在随机取样的基础上。它是运用概率估计的方法;抽样推断的误差可以事先计算并加以控制。
抽样推断的主要内容为:参数估计和假设检验 二、抽样的基本概念 1、全及总体和样本总体
全及总体是我们所要研究的对象,而样本总体则是我们所要观察的对象,两者是有区别而又有联系的不同范畴。全及总体又称母体,简称总体,它是指所要认识的,具有某种共同性质的许多单位的集合体。样本总体又称子样,简称样本,是从全及总体中随机抽取出来,代表全及总体的那部分单位的集合体。样本总体的单位数称为样本容量,通常用小写英文字母n来表示。随着样本容量的增大,样本对总体的代表性越来越高,并且当样本单位数足够多时,样本平均数愈接近总体平均数。
如果说对于一次抽样调查,全及总体是唯一确定的,那么样本总体就不是这样,样本是不确定的,一个全及总体可能抽出很多个样本总体,样本的个数和样本的容量有关,也和抽样的方法有关。
2、全及指标和抽样指标
根据全及总体各个单位的标志值或标志属性计算的,反映总体某种属性或特征的综合指示称为全及指标。常用的全及指标有总体平均数(或总体成数)、总体标准差(或总体方差 )。
由样本总体各单位标志值计算出来反映样本特征,用来估计全及指标的综合指标称为统计量(抽样指标)。统计量是样本变量的函数,用来估计总体参数,因此与总体参数相对应,统计量有样本平均数(或抽样成数)、样本标准差(或
样本方差 )。
对于一个问题全及总体是唯一确定的,所以全及指标也是唯一确定的,全及指标也称为参数,它是待估计的数。而统计量则是随机变量,它的取值随样本的不同而发生变化。
3、样本容量和样本个数
样本容量是指一个样本所包含的单位数。通常将样本单位数不少于30个的样本称为大样本,不及30个的称为小样本。社会经济统计的抽样调查多属于大样本调查。样本个数又称样本可能数目。指从一个总体中可能抽取的样本个数。一个总体有多少样本,则样本统计量就有多少种取值,从而形成该统计量的分布,此分布是抽样推断的基础。
4、重复抽样和不重复抽样 5、抽样组织形式
常用的抽样组织形式有:简单随机抽样、类型抽样、等距抽样和整群抽样
第二节 抽样估计的一般原理
一、抽样误差
抽样误差是指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。因此,又称为随机误差,它不包括登记误差,也不包括系统性误差。
影响抽样误差的因素有:总体各单位标志值的差异程度;样本的单位数;抽样的方法;抽样调查的组织形式。
1、抽样平均误差。抽样平均误差是反映抽样误差一般水平的指标,它的实质含义是指抽样平均数(或成数)的标准差。即它反映了抽样指标与总体指标的平均离差程度。抽样平均误差的作用首先表现在它能够说明样本指标代表性的大小。平均误差大,说明样本指标对总体指标的代表性低;反之则说明样本指标对总体指标的代表性高。
抽样平均误差的计算:
p(1?p)?重复抽样: ?x? ?p?
nnp(1?p)nn(1?) ) ?p?nNnN2、抽样极限误差。抽样极限则说明样本指标对总体指标的代表性高。其次,平均误差还说明样本指标与总体指标差别的一般范围。这个范围实际上就是抽样极限误差。
误差是指用绝对值形式表示的样本指标与总体指标偏差的可允许的最大范围。它表明被估计的总体指标有希望落在一个以样本指标为基础的可能范围。它是由抽样指标变动可允许的上限或下限与总体指标之差的绝对值求得的。
由于总体平均数和总体成数是未知的,它要靠实测的抽样平均数成数来估计。因而抽样极限误差的实际意义是希望总体平均数落在抽样平均数的范围内,总体成数落在抽样成数的范围内。
基于理论上的要求,抽样极限误差需要用抽样平均误差?x或?p为标准单位
不重复抽样: ?x??2(1?来衡量。即把极限误差 △x或 △p相应除以?x或?p,得出相对的误差程度t倍,t称为抽样误差的概率度。于是有:
?x?t?x
?p?t?p
二、抽样估计方法
抽样估计就是利用实际调查计算的样本指标值来估计相应的总体指标数值。抽样估计有点估计和区间估计两种。
(一)参数点估计的基本特点:根据总体指标的结构形式设计样本指标作为总体参数的估计量,并以样本指标的实际值直接作为相应总体参数的估计值。
点估计的优良标准是无偏性、一致性和有效性。
抽样估计的置信度是表明抽样指标和总体指标的误差不超过一定范围的概率有多大。
(二)参数区间估计的基本特点
根据给定的概率保证程度的要求,利用实际抽样资料,指出总体被估计值的上限和下限,即指出总体参数可能存在的区间范围,而不是直接给出总体参数的估计值。总体参数区间估计根据给定的概率保证程度的要求,利用实际抽样资料,指出被估计值的上限和下限,即指出总体参数可能存在的区间范围。总体参数区间估计必须同时具备估计值、抽样误差范围和概率保证程度三个要素。
区间估计的内容包括总体平均数和总体成数的估计。
例1、某学校进行一次英语测验,为了解学生的考试情况,随机抽选部分学生进行调查,所得资料如下: 1、 考试成绩 60以下2 、 60-70 70-80 80-90 90- 90-100 3、 学生人数4 、 10 5、 20 6、 22 7、 40 8、 8 试以95。45%的可靠性估计该校学生英语考试的平均成绩的范围及该校学生成绩在80分以上的学生所占的比重的范围。
解:(1)该校学生英语考试的平均成绩的范围:
xf7660?x???76.6 f100?σ=
?(x?x)2ff?11.377?x???1.1377
100n△x = tμx=2×1.1377=2.2754
该校学生考试的平均成绩的区间范围是: x - △x≤X≤ x+△x
76.6-2.2754≤X≤76.6+2.2754 74.32≤X≤78.89
(2)该校学生成绩在80分以上的学生所占的比重的范围
n48p?1??48%
n100p(1?p)0.48(1?0.48)?p???0.04996
n100△p=tμp=2×0.04996=0.09992 80分以上学生所占的比重的范围:
?12944?11.377 100