第六章 参数估计和假设检验
教学目的及要求:了解参数的点估计、区间估计的含义,掌握区间估计的几个概念,包括置信水平、置信区间、小概率事件,熟练掌握参数区间估计的计算方法,了解不同抽样组织形式下的参数估计,掌握参数估计中样本量的确定。了解假设检验的原假设和备择假设的含义,假设检验的两类错误,掌握总体均值的检验方法。
本章重点与难点:区间估计的计算与总体均值的假设检验方法。 计划课时:授课6课时;技能训练2课时。 授课特点:案例教学
第一节 点估计和区间估计
一、总体参数估计概述 ? 1、总体参数估计定义
? 就是以样本统计量来估计总体参数,总体参数是常数,而统计量是随机变量。
? 2、参数估计应满足的两个条件 二、参数的点估计
? 用样本的估计量直接作为总体参数的估计值 例如:用样本均值直接作为总体均值的估计
例如:根据一个抽出的随机样本计算的平均分数为80分,我们就用80分作为全班考试成绩的平均分数的一个估计值,这就是点估计。
再例如,要估计一批产品的合格率,根据抽样结果合格率为96%,将96%直接作为这批产品合格率的估计值,这也是点估计 三、参数的区间估计 (一)参数的区间估计的含义
? 区间估计:计算抽样平均误差,指出估计的可信程度,进而在点估计的基础上,确定总体参数的所在范围或区间。
(二)有关区间估计的几个概念 置信水平
1. 将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 2. 表示为 (1 - ????
??为是总体参数未在区间内的比例?
3. 常用的置信水平值有 99%, 95%, 90%
相应的显著性水平??为0.01,0.05,0.10
置信区间
1. 由样本统计量所构造的总体参数的估计区间称为置信区间
2. 统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间
3. 用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值
我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个
4. 由样本均值的抽样分布可知,在重复抽样或无限总体抽样的情况下,样本均值的数学期望等于总体均值, 5. 样本均值的标准差为
?xx??n由此可知样本均值落在总体均值?的两侧各为一个抽样标准差范围内的概率为0。6873
落在总体均值两个抽样标准差范围内的概率为0。9545 落在总体均值三个抽样标准差范围内的概率为0。9973 影响区间宽度的因素
1.总体数据的离散程度,用 ? 来测度 2.样本均值标准差
3.置信水平 (1 - ?),影响 z 的大小 评价估计量的标准
无偏性:估计量抽样分布的数学期望等于被估计的总体参数
有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效 一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数 总体均值的区间估计(用Z统计量) 1. 假定条件
总体服从正态分布,且方差(?2) 未知
如果不是正态分布,可由正态分布来近似 (n ? 30) 2.使用正态分布统计量 z
z?x??~N(0,1) ?n3.总体均值 ? 在1-? 置信水平下的置信区间为
x?z?2?n或x?z?2s(?未知) n总体均值的区间估计例题分析
【 例 】一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95% (属正态总体、?2已知,用统计量Z) 25袋食品的重量 112.5 102.6 100.0 116.6 136.8 101.0 107.5 123.5 95.4 102.8 103.0 95.0 102.0 97.8 101.5 102.0 108.8 101.6 108.6 98.4 100.5 115.6 102.2 105.0 93.3 解:已知X~N(?,102),n=25, 1-? = 95%,z?/2=1.96。根据样本数据计算得: 总体均值?在1-?置信水平下的置信区间为